t2_pr9

Выравнивания. Часть1.

Глобальное парное выравнивание гомологичных белков.

В этом задании нужно было построить глобальное выравнивание трех пар белков Ecoli и Bacsu, чьи идентификаторы имеют одинаковые мнемоники функции. Такие идентификаторы были скачаны программой infoseq и найдены одинаковые на Python.

Protein Name	ID1	ID 2	Score	Identity	Similarity	Gaps	Indels
HTH-type transcriptional repressor PurR	PURR_ECOLI	PURR_BACSU	40.5	15.3%	32.2%	120	14
Motility protein A	MOTA_ECOLI	MOTA_BACSU	235.5	26.1%	43.1%	33	8
Adenylate kinase	KAD_ECOLI	KAD_BACSU	527.5	46.4%	65.8%	13	3

Локальное парное выравнивание гомологичных белков.

Те же три пары выравниваем программой water.

Protein Name	ID1	ID 2	Score	Identity	Similarity	Gaps	Indels	Coverage 1	Coverage 2
HTH-type transcriptional repressor PurR	PURR_ECOLI	PURR_BACSU	52.0	17.5%	35.4%	90	13	82.4%	86.0%
Motility protein A	MOTA_ECOLI	MOTA_BACSU	240.5	27.2%	44.9%	25	4	96.6%	97.8%
Adenylate kinase	KAD_ECOLI	KAD_BACSU	527.5	47.2%	67.0%	9	2	100%	98.1%

Результат применения программ выравнивания к неродственным белкам.

Глобальное выравнивание (needle) негомологичных MOTA_ECOLI и KAD_BACSU:

ID1	ID 2	Score	Identity	Similarity	Gaps	Indels
MOTA_ECOLI	KAD_BACSU	17.0	11.4%	18.0%	210	10

Очевидно, "не выравнялось": низкие вес и доля схожих аминокислот в позициях; 10 инделей на достаточно небольшом участке (белки имеют длину порядка 200-300 аминокислот). Глобальные выраванивания в принципе используются только тогда, когда заранее известно, что белки гомологичны. В нашем случае KAD (аденилат киназа) - это белок из класса трансфераз, переносит терминальную фосфатную группу между АТФ и АМФ; MotA - белок, отвечающий за подвижность ресничек (моторный белок). Эти белки совершенно разные по функциям, полученное "выравнивание" не соответствует никакому эволюционному процессу.

Локальное выравниавние (water) той же пары негомологичных белков:

ID1	ID 2	Score	Identity	Similarity	Gaps	Indels	Coverage 1	Coverage 2
MOTA_ECOLI	KAD_BACSU	28.0	28.0%	52.0%	7	1	6.1%	11.5%

На первый взгляд выраванивание кажется лучше аналогичного глобального: половина аминокислот в позициях схожи, вес сопоставим с весом выравнивания двух гомологичных белков (PURR_ECOLI, PURR_BACSU): 28 в сравнении с 40. Но покрытие выравнивания очень низкое, само выравнивание имеет длину всего 18 аминокислот, из них треть - гэпы. Можно было бы предположить, что эти белки имеют гомологичный участок, но в Swiss-Prot не указано, что белки имеют в этом месте какие-то важные участки, можно предположить, что никакой гомологии здесь тоже нет, и это "выравнивание" - только результат работы алгоритма.

Сохранение выравнивания в fasta-формате и импорт в Jalview.

Глобальное выравнивание белков KAD_ECOLI и KAD_BACSU в виде проекта Jalview.

Множественное выравнивание белков

В базе Swiss-Prot нашлось (infoseq) всего 13 белков с мнемоникой функции MotA, включая два, выравнивание для которых уже строилось. Для построения множественного выравнивания были взяты пять новых белков с той же мнемоникой из организмов соответсвенно:

Helicobacter pylori (MOTA_HELPY)
Treponema pallidum (MOTA_TREPA)
Salmonella typhimurium (MOTA_SALTY)
Borrelia burgdorferi (MOTA_BORBU)
Aquifex aeolicus (MOTA_AQUAE)

Глобальное выравнивание (muscle) белков MotA семи организмов в виде проекта Jalview.

Во-первых, можно утверждать, что все семь белков гомологичны: инделей достаточно мало: на протяжении всего выравнивания есть всего 7 мест, в которых хотя бы у одного из белков есть разрыв. Видно также, что наиболее похожи между собой белки из E.coli, Salmonella typhimurium: они имеют очень много совпадающих позиций и не имеют разрывов там, где у других пяти последовательностей одинаковые индели. Остальные шесть белков не очень похожи: не встречается больше двух полностью консервативных колонок. Тем не менее, при окраске по Blosum видно, что пусть однаковых аминокислот в позициях и не очень много, доля похожих (similarity) высока.

Вернуться на главную

Вернуться на страницу семестра