Home About Materials FBB site

1. Карта локального сходства двух полипротеинов

Была построена карта локального сходства полипротеина вируса полиомиелита (AC P23069) - Query, и полипротеина вируса ящура (AC P03305) - Subject.

Xарактеристики двух лучших выравниваний:

Identities Positives Query length Subject length Gaps Score Score (bits)
№ 1 29% 48% 613 644 57(8%) 638 250
№ 2 31% 44% 410 431 65(14%) 399 158


Для этих же двух локальных выравниваний были определены названия зрелых белков, к которым относятся соответствующие участки полипротеинов.

В первое локальное выравнивание попадают следующие участки Query(1592-2204):
1564-2205 Protein 3CD.
1564-1745 Protease 3C.
1746-2205 RNA-directed RNA polymerase.

и следующие участки Subject(1684-2327):
1650-1862 Protease 3C.
1863-2332 RNA-directed RNA polymerase 3D-POL.


Во второе локальное выравнивание попадают следующие участки Query(1008-1417):
1029-1125 Protein 2B.
1126-1454 Protein 2C.

и следующие участки Subject(953-1383):
954-1107 Protein 2B.
1108-1425 Protein 2C.

2. Сравнение веса выравнивания со случайным

Для двух пар белков: предположительно гомологичных (ARAA_ECOLI и ARAA_BACSU) и предположительно неродственных (TOP1_ECOLI и UXAB_BACSU) сравнили вес оптимального локального выравнивания с весами оптимальных локальных выравниваний первого белка со 100 случайно перемешанными последовательностями второго.
ID 1 ID 2 Score m (медиана) Q1 (верхний квартиль) Score (bits) P
ARAA_ECOLI ARAA_BACSU 1434.5 54,25 60,50 221,84 1,66e-67
TOP1_ECOLI UXAB_BACSU 57,00 56,5 63,25 1,07 0,475

2b. Проверка формулы для перевода в биты.
Были сделаны уже не 100 перемешиваний, а 1000. Формула для пересчёта веса в биты должна давать для уровня верхней 1/8 весов случайных выравниваний значение в 3 бита (хотя бы приближённо). У меня получилось -3,25 (?).

xlsx

3. BLAST: поиск гомологов в банке

Был взят белок Putative periplasmic iron-binding protein из организма Serratia plymuthica PRI-2C (ANS42615.1). Программой BLAST были найдены в банке Swiss-Prot белки с последовательностями, наиболее сходными с данной. Характеристики двух лучших находок:
ID AC Organism Identities Positives Query length Subject length Gaps Score Score (bits) Expect Query coverage
YFEA_YERPE Q56952.2 Yersinia pestis 80% 86% 296 303 7(2%) 1265 491 6e-176 94.3%
Y362_HAEIN Q57449.1 Haemophilus influenzae Rd KW20 74% 83% 287 287 0(0%) 1138 442 7e-157 91.4%

© Титова Алена, 2018