Таблица 1. Характеристики глобального парного выравнивания трёх пар белков (needle)

Protein name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Motility protein A MOTA_ECOLI MOTA_BACSU 235.5 26.1 43.1 33 8
Methionyl-tRNA formyltransferase FMT_ECOLI FMT_BACSU 664.5 42.7 56.1 24 4
Molybdopterin synthase sulfur carrier subunit MOAD_ECOLI MOAD_ECOLI 118.0 34.6 58.0 4 2

Таблица 2. Характеристики локального парного выравнивания трёх пар белков (water)

Protein name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Motility protein A MOTA_ECOLI MOTA_BACSU 240.5 27.2 44.9 25 6 96.61 97.78
Methionyl-tRNA formyltransferase FMT_ECOLI FMT_BACSU 670.0 46.1 60.9 1 1 93.97 93.69
Molybdopterin synthase sulfur carrier subunit MOAD_ECOLI MOAD_ECOLI 118.0 34.6 58.0 4 2 100.00 100.00

Комментарии к выравниваниям

Процент идентичности для каждого из белков выше 25, поэтому можно назвать их гомологичными.

Разница между глобальным и локальным выравниванием не велика, поэтому глобальное выравнивание вполне достаточно для оценки родства этих белков.

Некоторые пары букв могли быть не сопоставлены в глобальном выравнивании в связии с оптимизацией скоринга в разных алгоритмах.

Результат применения программ выравнивания к неродственным белкам

Algorithm ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
needle RNC_ECOLI[1] EFP_BACSU [2] 23.0 12.6 19.5 175 13 - -
water RNC_ECOLI EFP_BACSU 33.5 28.0 36.0 22 5 30.09 32.43

1. Elongation factor P

2. Ribonuclease 3

Очевидно, что рибонуклеаза 3 и фактор элонгации P - это неродственные белки. Очень низкий процент идентичности (12.6% для глобального и 28.0% для локального выравнивания) подтверждает это. Мизерный процент сходства (19.5% и 36.0% соответственно) также говорит об отсутствии значительной общей эволюционной истории между этими белками.

Глобальное выравнивание (алгоритм needle) в данном случае практически бесполезно. Очень низкий Score (23.0) и большое количество гэпов (175!) показывают, что алгоритм пытается "втиснуть" одну последовательность в другую, что не имеет биологического смысла.

Локальное выравнивание (алгоритм water) демонстрирует немного более высокий Score (33.5) и процент идентичности (28.0%). Однако это не свидетельствует о гомологии. Скорее всего, это результат случайного совпадения небольших участков последовательностей. Покрытие последовательностей очень низкое (около 30%), что подтверждает, что выравниваются только очень короткие регионы.

Полученные результаты позволяют сделать вывод, что рибонуклеаза 3 и фактор элонгации P не являются гомологами и не имеют общего предка. Сходство между ними, обнаруженное локальным выравниванием, скорее всего, является результатом случайных совпадений в аминокислотных последовательностях и не имеет биологического значения.

Множественное выравнивание белков и импорт в Jalview

Мнемоника: MOTA

Полное имя белка: Motility protein A

Всего нашлось 15 белков, были выбраны: MOTA_TREPH, MOTA_AQUAE, MOTA_SALTY, MOTA_RHIME, MOTA_BPT4

Выравнивание было сделано в Jalview с помощью "Muscle with Defaults"

Не могу однозначно сказать, что выравнивание прошло хорошо, поскольку если же какие-то участки консервативности и присутсвуют, то разобросаны будто бы случайно и точечно. В связи с чем трудно выделить какие-то продолжительные участки с высокой консервативностью.

Стоит отметить, что MOTA_SALTY, MOTA_RHIME и MOTA_ECOLI имеют наибольшое число совпадений. Я это связываю с тем, что их длины наиболее схоже. Напротив можно заметить, что MOTA_BPT4 с наиболее отличающейся длиной выровнялся хуже всего.

Проект с выравниванием