Выравнивание последовательностей

Глобальное парное выравнивание гомологичных белков

Protein Name ID 1 ID 2 Score Identity, % Similarity, % Gaps Indels
Arginine repressor ARGR_ECOLI ARGR_BACSU 143,5 29,4 47,2 21 9
Molybdopterin molybdenumtransferase MOEA_ECOLI MOEA_BACSU 455 29,2 42,6 83 13
Thiol peroxidase TPX_ECOLI TPX_BACSU 337,5 40,9 62,6 7 4

Локальное парное выравнивание гомологичных белков

Protein Name ID 1 ID 2 Score Identity, % Similarity, % Gaps Indels Coverage 1, % Coverage 2, %
Arginine repressor ARGR_ECOLI ARGR_BACSU 146,5 31,9 50,7 13 6 87,2 91,9
Molybdopterin molybdenumtransferase MOEA_ECOLI MOEA_BACSU 465 32,3 47,2 37 10 93,4 94,9
Thiol peroxidase TPX_ECOLI TPX_BACSU 339,5 42,1 63,4 3 2 97,0 95,8

Комментарии к выравниваниям

Исходя из результатов проведённых выравниваний можно сделать вывод, что белки аргининовый репрессор и молибоптерин молибденумтрансфераза являются гомологичными, но бактерии с этими белками очень давно имели одного общего предка, так как проценты идентичности белков слишком близки к случайным показателям (у обоих около 30 %), а вот белок тиолпероксидаза точно гомологичен у этих двух видов бактерий, так как последовательности имеют высокий процент идентичности. Однако два этих непохожих у двух бактерий белка имеют несколько гомологичных участков, скорее всего связанных с осуществлением этими белками своих функций. В данном конкретном случае локальное выравнивание не очень сильно информативно, так как в результате проценты идентичности и схожести изменились не на очень большую величину (до 5 % в каждом случае). Больше всего информативности локальное выравнивание принесло для белка молибоптерин молибденумтрансферазы (процент схожести увеличился на 4,6 %).

Результат применения программ выравнивания к неродственным белкам

Программа для выравнивания ID 1 ID 2 Score Identity, % Similarity, % Gaps Indels Coverage 1, % Coverage 2, %
needle TPX_ECOLI MOEA_BACSU 21,5 9,2 17,9 298 19 - -
water TPX_ECOLI MOEA_BACSU 31 17,2 43,1 18 2 26,8 11,9

По результатам проведенного выравнивания видно, что эти белки никак не родственны и не гомологичны. На это указывает очень низкий процент идентичности и, в случае глобального выравнивания очень большое число гэпов. Для локального выравнивания в данном случае характерно относительно малое количество гэпов, но крайне низкий процент покрытия. Это может говорить о том, что небольшой похожий у двух белков участок является случайным совпадением.

Множественное выравнивание белков и импорт в Jalview

Для выполнения этого задания мною была выбрана мнемоника MOEA (полное имя - Molybdopterin molybdenumtransferase). Всего было найдено 15 белков, чьи идентификаторы начинаются с этой мнемоники. Помимо белков MOEA_ECOLI и MOEA_BACSU, для выравнивания было выбрано ещё 5 белков: MOEA_NOSS1, MOEA_HAEIN, MOEA_SALTY, MOEA_SYNE7, MOEA_SYNY3.

Для выполнения выравнивания сначала был создан списочный файл moea.txt на kodomo со строками sw:ID, где ID - идентификатор записи в Swiss-Prot. Затем был создан файл в формате fasta следующей командой:

seqret @moea.txt moea.fasta

После этого была запущена программа выравнивания muscle следующей командой:

muscle -align moea.fasta -output moea_alignment.fasta

После этого файл moea_alignment.fasta был импортирован в Jalview, затем колонки были раскрашены по проценту идентичности.

Все белки выровнялись нормально, белков, которые резко выбивались бы из общей структуры выравнивания найдено не было. Для данного выравнивания характерна чётко выраженная структура: наличие более консервативных и менее консервативных участков. Так, наиболее консервативными являются столбцы с номерами: 31, 49, 53, 59, 61-62, 72, 75, 77, 79-81, 83, 85, 88, 102, 108-109, 126-129, 132, 134, 138, 142, 165, 174, 178, 188, 197, 200, 206, 212, 216-218, 220-221, 227, 229, 232-234, 238, 250, 261, 273, 282, 285-288, 290, 293, 302-303, 312, 315-318, 334-339, 355, 391, 402, 415, 430, 440, 443.

Ссылка на файл с выравниванием.