1. Карта локального сходства двух полипротеинов
Была построена карта локального сходства полипротеина вируса полиомиелита (AC P23069) - Query, и
полипротеина вируса ящура (AC P03305) - Subject. Xарактеристики двух лучших выравниваний:
Для этих же двух локальных выравниваний были определены названия зрелых белков, к которым относятся соответствующие участки полипротеинов. В первое локальное выравнивание попадают следующие участки Query(1592-2204): 1564-2205 Protein 3CD. 1564-1745 Protease 3C. 1746-2205 RNA-directed RNA polymerase. и следующие участки Subject(1684-2327): 1650-1862 Protease 3C. 1863-2332 RNA-directed RNA polymerase 3D-POL. Во второе локальное выравнивание попадают следующие участки Query(1008-1417): 1029-1125 Protein 2B. 1126-1454 Protein 2C. и следующие участки Subject(953-1383): 954-1107 Protein 2B. 1108-1425 Protein 2C. 2. Сравнение веса выравнивания со случайнымДля двух пар белков: предположительно гомологичных (ARAA_ECOLI и ARAA_BACSU) и предположительно неродственных (TOP1_ECOLI и UXAB_BACSU) сравнили вес оптимального локального выравнивания с весами оптимальных локальных выравниваний первого белка со 100 случайно перемешанными последовательностями второго.
2b. Проверка формулы для перевода в биты. Были сделаны уже не 100 перемешиваний, а 1000. Формула для пересчёта веса в биты должна давать для уровня верхней 1/8 весов случайных выравниваний значение в 3 бита (хотя бы приближённо). У меня получилось -3,25 (?). xlsx 3. BLAST: поиск гомологов в банкеБыл взят белок Putative periplasmic iron-binding protein из организма Serratia plymuthica PRI-2C (ANS42615.1). Программой BLAST были найдены в банке Swiss-Prot белки с последовательностями, наиболее сходными с данной. Характеристики двух лучших находок:
|