Выравнивание последовательностей

Глобальное парное выравнивание

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
30S ribosomal protein S10 RS10_ECOLI RS10_BACSU 346.0 63.1 81.6 1 1
Biotin synthase BIOB_ECOLI BIOB_BACSU 470.0 28.5 49.1 69 4
Pur operon repressor PURR_ECOLI PURR_ECOLI 40.5 15.3 32.2 120 16

Локальное парное выравнивание

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels % Cover. 1 % Cover. 2
30S ribosomal protein S10 RS10_ECOLI RS10_BACSU 346.0 63.7 82.4 0 0 99.0 100.0
Biotin synthase BIOB_ECOLI BIOB_BACSU 477.5 35.0 59.9 6 5 84.7 86.3
HTH-type transcriptional repressor PurR PURR_ECOLI PURR_BACSU 52.0 17.5 35.4 90 14 82.4 86.0

Выравнивание неродственных белков

Для данного раздела было решено выбрать принципиально разные по функциям белки у B.subtilis, однако имеющие приблизительно одинаковую длину. Сигма-D фактор РНК-полимеразы (RNA polymerase sigma-D factor - RPSD_BACSU) был выровнен на белок, входящий в состав биопленки, окружающей бактерий (Major biofilm matrix component - TASA_BACSU). Результаты выравниваний сведены в таблицу ниже.

ID 1 ID 2 Score % Identity % Similarity Gaps Indels % Cover. 1 % Cover. 2
Глобальное выравнивание
TASA_BACSU RPSD_BACSU 65.5 12.7 22.1 209 14 - -
Локальное выравнивание
TASA_BACSU RPSD_BACSU 66.5 24.8 42.8 32 9 52.5 47.6

В полученных результатах очевидным является низкие Score, Identity и Similarity выравниваний, однако стоит обратить внимание на локальное выравнивание. Алгоритм water "выкинул" большие участки последовательностей (видно по низкому проценту покрытия), чтобы получить оптимальное выравнивание. Этим объясняются высокие Identity и Similarity, что говорит нам о нежелательности использования алгоритмов локального выравнивания на негомологичных белках.

Множественное выравнивание

Для выравнивания была выбрана мнемоника BIOB_* (Biotin synthase). В UniProt содержится 585 записей с данной мнемоникой (581 активных и 4 устаревших), более того, что помимо бактерий в выдаче присутствуют митохондриальные биотин синтазы эукариот с аналогичным идентификатором. Для выравнивания были выбраны: BIOB_ECOLI, BIOB_BACSU, BIOB_MYCTU (M. tuberculosis), BIOB_RHOJR(Rhodococcus jostii), BIOB_NITEU(Nitrosomonas europaea), BIOB_AGRRK(Agrobacterium radiobacter) и BIOB_YEAST(S.cerevisiae - для сравнения с прокариотами).

Последовательности были получены через JailView и выровнены с помощью Muscle. Ознакомится с выравниванием можно по ссылке.

Выравнивание говорит о значительной дивергенции выбранных белков, так как можно выделить большое количество неконсервативных участков. Наиболее схожие участки, скорее всего являются частями активного центра или зоны связывания субстрата, находятся в позициях 101-109, 207-211, 204-254, 273-281, 340-360. Дополнительно в MEGA7 по полученному выравнивания было построено дерево с UPGMA алгоритмом (ссылка) В дереве выделяется кластер протеобактерий ((E.coli, N.europaea),A.radiobacter) и (M.tuberculosis, R. jostii), что в целом говорит о эволюционности выравнивания, однако о высокой скорости эволюции белка. (Если на первый взгляд последовательности не консервативны, но отражают эволюцию, то возможно их evolution rate довольно высок)

Выравнивание PriS P.furiosus на гомологичный белок

Для выравнивания была выбрана PriS археи Halobacterium salinarum, протеом которой сравнивался с протеомом P. furiosus.

Последовательности были выравнены алгоритмом needle. Скачать выдачу программы можно по ссылке. Дополнительно приведена таблица-сравнение аналогично заданию 1.

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
DNA primase small subunit PriS PRIS_PYRFU PRIS_HALSA 212.0 21.5 33.6 166 21

По результатам выравнивания можно сказать о гомологичности данных белков. Их Identity и Similarity выше аналогичных полей для глобального выравнивания негомологичных белков. Можно предположить, что данный белок эволюционирует значительно быстрее высококонсервативных (результаты выравнивания сильно ниже RS10) либо данные организмы сильно дивергировали (действительно, сем. Thermococacceae является сестринской кладой к остальным Euryarchaeota, куда входит Halobacteriaceae).