Выравнивания. Часть1.

Глобальное парное выравнивание гомологичных белков.

В этом задании нужно было построить глобальное выравнивание трех пар белков Ecoli и Bacsu, чьи идентификаторы имеют одинаковые мнемоники функции. Такие идентификаторы были скачаны программой infoseq и найдены одинаковые на Python.

Protein Name ID1 ID 2 Score Identity Similarity Gaps Indels
HTH-type transcriptional repressor PurR PURR_ECOLI PURR_BACSU 40.5 15.3% 32.2% 120 14
Motility protein A MOTA_ECOLI MOTA_BACSU 235.5 26.1% 43.1% 33 8
Adenylate kinase KAD_ECOLI KAD_BACSU 527.5 46.4% 65.8% 13 3

Локальное парное выравнивание гомологичных белков.

Те же три пары выравниваем программой water.

Protein Name ID1 ID 2 Score Identity Similarity Gaps Indels Coverage 1 Coverage 2
HTH-type transcriptional repressor PurR PURR_ECOLI PURR_BACSU 52.0 17.5% 35.4% 90 13 82.4% 86.0%
Motility protein A MOTA_ECOLI MOTA_BACSU 240.5 27.2% 44.9% 25 4 96.6% 97.8%
Adenylate kinase KAD_ECOLI KAD_BACSU 527.5 47.2% 67.0% 9 2 100% 98.1%

Результат применения программ выравнивания к неродственным белкам.

Глобальное выравнивание (needle) негомологичных MOTA_ECOLI и KAD_BACSU:

ID1 ID 2 Score Identity Similarity Gaps Indels
MOTA_ECOLI KAD_BACSU 17.0 11.4% 18.0% 210 10

Очевидно, "не выравнялось": низкие вес и доля схожих аминокислот в позициях; 10 инделей на достаточно небольшом участке (белки имеют длину порядка 200-300 аминокислот). Глобальные выраванивания в принципе используются только тогда, когда заранее известно, что белки гомологичны. В нашем случае KAD (аденилат киназа) - это белок из класса трансфераз, переносит терминальную фосфатную группу между АТФ и АМФ; MotA - белок, отвечающий за подвижность ресничек (моторный белок). Эти белки совершенно разные по функциям, полученное "выравнивание" не соответствует никакому эволюционному процессу.

Локальное выравниавние (water) той же пары негомологичных белков:

ID1 ID 2 Score Identity Similarity Gaps Indels Coverage 1 Coverage 2
MOTA_ECOLI KAD_BACSU 28.0 28.0% 52.0% 7 1 6.1% 11.5%

На первый взгляд выраванивание кажется лучше аналогичного глобального: половина аминокислот в позициях схожи, вес сопоставим с весом выравнивания двух гомологичных белков (PURR_ECOLI, PURR_BACSU): 28 в сравнении с 40. Но покрытие выравнивания очень низкое, само выравнивание имеет длину всего 18 аминокислот, из них треть - гэпы. Можно было бы предположить, что эти белки имеют гомологичный участок, но в Swiss-Prot не указано, что белки имеют в этом месте какие-то важные участки, можно предположить, что никакой гомологии здесь тоже нет, и это "выравнивание" - только результат работы алгоритма.

Сохранение выравнивания в fasta-формате и импорт в Jalview.

Глобальное выравнивание белков KAD_ECOLI и KAD_BACSU в виде проекта Jalview.

Множественное выравнивание белков

В базе Swiss-Prot нашлось (infoseq) всего 13 белков с мнемоникой функции MotA, включая два, выравнивание для которых уже строилось. Для построения множественного выравнивания были взяты пять новых белков с той же мнемоникой из организмов соответсвенно:

  1. Helicobacter pylori (MOTA_HELPY)
  2. Treponema pallidum (MOTA_TREPA)
  3. Salmonella typhimurium (MOTA_SALTY)
  4. Borrelia burgdorferi (MOTA_BORBU)
  5. Aquifex aeolicus (MOTA_AQUAE)
Глобальное выравнивание (muscle) белков MotA семи организмов в виде проекта Jalview.

Во-первых, можно утверждать, что все семь белков гомологичны: инделей достаточно мало: на протяжении всего выравнивания есть всего 7 мест, в которых хотя бы у одного из белков есть разрыв. Видно также, что наиболее похожи между собой белки из E.coli, Salmonella typhimurium: они имеют очень много совпадающих позиций и не имеют разрывов там, где у других пяти последовательностей одинаковые индели. Остальные шесть белков не очень похожи: не встречается больше двух полностью консервативных колонок. Тем не менее, при окраске по Blosum видно, что пусть однаковых аминокислот в позициях и не очень много, доля похожих (similarity) высока.

Вернуться на главную

Вернуться на страницу семестра


© potapenko 2017-2018