В этом задании нужно было построить глобальное выравнивание трех пар белков Ecoli и Bacsu, чьи идентификаторы имеют одинаковые мнемоники функции. Такие идентификаторы были скачаны программой infoseq и найдены одинаковые на Python.
Protein Name | ID1 | ID 2 | Score | Identity | Similarity | Gaps | Indels |
HTH-type transcriptional repressor PurR | PURR_ECOLI | PURR_BACSU | 40.5 | 15.3% | 32.2% | 120 | 14 |
Motility protein A | MOTA_ECOLI | MOTA_BACSU | 235.5 | 26.1% | 43.1% | 33 | 8 |
Adenylate kinase | KAD_ECOLI | KAD_BACSU | 527.5 | 46.4% | 65.8% | 13 | 3 |
Те же три пары выравниваем программой water.
Protein Name | ID1 | ID 2 | Score | Identity | Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
HTH-type transcriptional repressor PurR | PURR_ECOLI | PURR_BACSU | 52.0 | 17.5% | 35.4% | 90 | 13 | 82.4% | 86.0% |
Motility protein A | MOTA_ECOLI | MOTA_BACSU | 240.5 | 27.2% | 44.9% | 25 | 4 | 96.6% | 97.8% |
Adenylate kinase | KAD_ECOLI | KAD_BACSU | 527.5 | 47.2% | 67.0% | 9 | 2 | 100% | 98.1% |
Глобальное выравнивание (needle) негомологичных MOTA_ECOLI и KAD_BACSU:
ID1 | ID 2 | Score | Identity | Similarity | Gaps | Indels |
MOTA_ECOLI | KAD_BACSU | 17.0 | 11.4% | 18.0% | 210 | 10 |
Очевидно, "не выравнялось": низкие вес и доля схожих аминокислот в позициях; 10 инделей на достаточно небольшом участке (белки имеют длину порядка 200-300 аминокислот). Глобальные выраванивания в принципе используются только тогда, когда заранее известно, что белки гомологичны. В нашем случае KAD (аденилат киназа) - это белок из класса трансфераз, переносит терминальную фосфатную группу между АТФ и АМФ; MotA - белок, отвечающий за подвижность ресничек (моторный белок). Эти белки совершенно разные по функциям, полученное "выравнивание" не соответствует никакому эволюционному процессу.
Локальное выравниавние (water) той же пары негомологичных белков:
ID1 | ID 2 | Score | Identity | Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
MOTA_ECOLI | KAD_BACSU | 28.0 | 28.0% | 52.0% | 7 | 1 | 6.1% | 11.5% |
На первый взгляд выраванивание кажется лучше аналогичного глобального: половина аминокислот в позициях схожи, вес сопоставим с весом выравнивания двух гомологичных белков (PURR_ECOLI, PURR_BACSU): 28 в сравнении с 40. Но покрытие выравнивания очень низкое, само выравнивание имеет длину всего 18 аминокислот, из них треть - гэпы. Можно было бы предположить, что эти белки имеют гомологичный участок, но в Swiss-Prot не указано, что белки имеют в этом месте какие-то важные участки, можно предположить, что никакой гомологии здесь тоже нет, и это "выравнивание" - только результат работы алгоритма.
В базе Swiss-Prot нашлось (infoseq) всего 13 белков с мнемоникой функции MotA, включая два, выравнивание для которых уже строилось. Для построения множественного выравнивания были взяты пять новых белков с той же мнемоникой из организмов соответсвенно:
Во-первых, можно утверждать, что все семь белков гомологичны: инделей достаточно мало: на протяжении всего выравнивания есть всего 7 мест, в которых хотя бы у одного из белков есть разрыв. Видно также, что наиболее похожи между собой белки из E.coli, Salmonella typhimurium: они имеют очень много совпадающих позиций и не имеют разрывов там, где у других пяти последовательностей одинаковые индели. Остальные шесть белков не очень похожи: не встречается больше двух полностью консервативных колонок. Тем не менее, при окраске по Blosum видно, что пусть однаковых аминокислот в позициях и не очень много, доля похожих (similarity) высока.
Вернуться на страницу семестра
© potapenko 2017-2018