Protein Name | ID 1 | ID 2 | Score | Identity, % | Similarity, % | Gaps | Indels |
---|---|---|---|---|---|---|---|
Arginine repressor | ARGR_ECOLI | ARGR_BACSU | 143,5 | 29,4 | 47,2 | 21 | 9 |
Molybdopterin molybdenumtransferase | MOEA_ECOLI | MOEA_BACSU | 455 | 29,2 | 42,6 | 83 | 13 |
Thiol peroxidase | TPX_ECOLI | TPX_BACSU | 337,5 | 40,9 | 62,6 | 7 | 4 |
Protein Name | ID 1 | ID 2 | Score | Identity, % | Similarity, % | Gaps | Indels | Coverage 1, % | Coverage 2, % |
---|---|---|---|---|---|---|---|---|---|
Arginine repressor | ARGR_ECOLI | ARGR_BACSU | 146,5 | 31,9 | 50,7 | 13 | 6 | 87,2 | 91,9 |
Molybdopterin molybdenumtransferase | MOEA_ECOLI | MOEA_BACSU | 465 | 32,3 | 47,2 | 37 | 10 | 93,4 | 94,9 |
Thiol peroxidase | TPX_ECOLI | TPX_BACSU | 339,5 | 42,1 | 63,4 | 3 | 2 | 97,0 | 95,8 |
Исходя из результатов проведённых выравниваний можно сделать вывод, что белки аргининовый репрессор и молибоптерин молибденумтрансфераза являются гомологичными, но бактерии с этими белками очень давно имели одного общего предка, так как проценты идентичности белков слишком близки к случайным показателям (у обоих около 30 %), а вот белок тиолпероксидаза точно гомологичен у этих двух видов бактерий, так как последовательности имеют высокий процент идентичности. Однако два этих непохожих у двух бактерий белка имеют несколько гомологичных участков, скорее всего связанных с осуществлением этими белками своих функций. В данном конкретном случае локальное выравнивание не очень сильно информативно, так как в результате проценты идентичности и схожести изменились не на очень большую величину (до 5 % в каждом случае). Больше всего информативности локальное выравнивание принесло для белка молибоптерин молибденумтрансферазы (процент схожести увеличился на 4,6 %).
Программа для выравнивания | ID 1 | ID 2 | Score | Identity, % | Similarity, % | Gaps | Indels | Coverage 1, % | Coverage 2, % |
---|---|---|---|---|---|---|---|---|---|
needle | TPX_ECOLI | MOEA_BACSU | 21,5 | 9,2 | 17,9 | 298 | 19 | - | - |
water | TPX_ECOLI | MOEA_BACSU | 31 | 17,2 | 43,1 | 18 | 2 | 26,8 | 11,9 |
По результатам проведенного выравнивания видно, что эти белки никак не родственны и не гомологичны. На это указывает очень низкий процент идентичности и, в случае глобального выравнивания очень большое число гэпов. Для локального выравнивания в данном случае характерно относительно малое количество гэпов, но крайне низкий процент покрытия. Это может говорить о том, что небольшой похожий у двух белков участок является случайным совпадением.
Для выполнения этого задания мною была выбрана мнемоника MOEA (полное имя - Molybdopterin molybdenumtransferase). Всего было найдено 15 белков, чьи идентификаторы начинаются с этой мнемоники. Помимо белков MOEA_ECOLI и MOEA_BACSU, для выравнивания было выбрано ещё 5 белков: MOEA_NOSS1, MOEA_HAEIN, MOEA_SALTY, MOEA_SYNE7, MOEA_SYNY3.
Для выполнения выравнивания сначала был создан списочный файл moea.txt на kodomo со строками sw:ID, где ID - идентификатор записи в Swiss-Prot. Затем был создан файл в формате fasta следующей командой:
seqret @moea.txt moea.fasta
После этого была запущена программа выравнивания muscle следующей командой:
muscle -align moea.fasta -output moea_alignment.fasta
После этого файл moea_alignment.fasta был импортирован в Jalview, затем колонки были раскрашены по проценту идентичности.
Все белки выровнялись нормально, белков, которые резко выбивались бы из общей структуры выравнивания найдено не было. Для данного выравнивания характерна чётко выраженная структура: наличие более консервативных и менее консервативных участков. Так, наиболее консервативными являются столбцы с номерами: 31, 49, 53, 59, 61-62, 72, 75, 77, 79-81, 83, 85, 88, 102, 108-109, 126-129, 132, 134, 138, 142, 165, 174, 178, 188, 197, 200, 206, 212, 216-218, 220-221, 227, 229, 232-234, 238, 250, 261, 273, 282, 285-288, 290, 293, 302-303, 312, 315-318, 334-339, 355, 391, 402, 415, 430, 440, 443.
Ссылка на файл с выравниванием.