Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|
30S ribosomal protein S10 | RS10_ECOLI | RS10_BACSU | 346.0 | 63.1 | 81.6 | 1 | 1 |
Biotin synthase | BIOB_ECOLI | BIOB_BACSU | 470.0 | 28.5 | 49.1 | 69 | 4 |
Pur operon repressor | PURR_ECOLI | PURR_ECOLI | 40.5 | 15.3 | 32.2 | 120 | 16 |
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | % Cover. 1 | % Cover. 2 |
---|---|---|---|---|---|---|---|---|---|
30S ribosomal protein S10 | RS10_ECOLI | RS10_BACSU | 346.0 | 63.7 | 82.4 | 0 | 0 | 99.0 | 100.0 |
Biotin synthase | BIOB_ECOLI | BIOB_BACSU | 477.5 | 35.0 | 59.9 | 6 | 5 | 84.7 | 86.3 |
HTH-type transcriptional repressor PurR | PURR_ECOLI | PURR_BACSU | 52.0 | 17.5 | 35.4 | 90 | 14 | 82.4 | 86.0 |
Для данного раздела было решено выбрать принципиально разные по функциям белки у B.subtilis, однако имеющие приблизительно одинаковую длину. Сигма-D фактор РНК-полимеразы (RNA polymerase sigma-D factor - RPSD_BACSU) был выровнен на белок, входящий в состав биопленки, окружающей бактерий (Major biofilm matrix component - TASA_BACSU). Результаты выравниваний сведены в таблицу ниже.
ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | % Cover. 1 | % Cover. 2 |
---|---|---|---|---|---|---|---|---|
Глобальное выравнивание | ||||||||
TASA_BACSU | RPSD_BACSU | 65.5 | 12.7 | 22.1 | 209 | 14 | - | - |
Локальное выравнивание | ||||||||
TASA_BACSU | RPSD_BACSU | 66.5 | 24.8 | 42.8 | 32 | 9 | 52.5 | 47.6 |
В полученных результатах очевидным является низкие Score, Identity и Similarity выравниваний, однако стоит обратить внимание на локальное выравнивание. Алгоритм water "выкинул" большие участки последовательностей (видно по низкому проценту покрытия), чтобы получить оптимальное выравнивание. Этим объясняются высокие Identity и Similarity, что говорит нам о нежелательности использования алгоритмов локального выравнивания на негомологичных белках.
Для выравнивания была выбрана мнемоника BIOB_* (Biotin synthase). В UniProt содержится 585 записей с данной мнемоникой (581 активных и 4 устаревших), более того, что помимо бактерий в выдаче присутствуют митохондриальные биотин синтазы эукариот с аналогичным идентификатором. Для выравнивания были выбраны: BIOB_ECOLI, BIOB_BACSU, BIOB_MYCTU (M. tuberculosis), BIOB_RHOJR(Rhodococcus jostii), BIOB_NITEU(Nitrosomonas europaea), BIOB_AGRRK(Agrobacterium radiobacter) и BIOB_YEAST(S.cerevisiae - для сравнения с прокариотами).
Последовательности были получены через JailView и выровнены с помощью Muscle. Ознакомится с выравниванием можно по ссылке.
Выравнивание говорит о значительной дивергенции выбранных белков, так как можно выделить большое количество неконсервативных участков. Наиболее схожие участки, скорее всего являются частями активного центра или зоны связывания субстрата, находятся в позициях 101-109, 207-211, 204-254, 273-281, 340-360. Дополнительно в MEGA7 по полученному выравнивания было построено дерево с UPGMA алгоритмом (ссылка) В дереве выделяется кластер протеобактерий ((E.coli, N.europaea),A.radiobacter) и (M.tuberculosis, R. jostii), что в целом говорит о эволюционности выравнивания, однако о высокой скорости эволюции белка. (Если на первый взгляд последовательности не консервативны, но отражают эволюцию, то возможно их evolution rate довольно высок)
Для выравнивания была выбрана PriS археи Halobacterium salinarum, протеом которой сравнивался с протеомом P. furiosus.
Последовательности были выравнены алгоритмом needle. Скачать выдачу программы можно по ссылке. Дополнительно приведена таблица-сравнение аналогично заданию 1.
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|
DNA primase small subunit PriS | PRIS_PYRFU | PRIS_HALSA | 212.0 | 21.5 | 33.6 | 166 | 21 |
По результатам выравнивания можно сказать о гомологичности данных белков. Их Identity и Similarity выше аналогичных полей для глобального выравнивания негомологичных белков. Можно предположить, что данный белок эволюционирует значительно быстрее высококонсервативных (результаты выравнивания сильно ниже RS10) либо данные организмы сильно дивергировали (действительно, сем. Thermococacceae является сестринской кладой к остальным Euryarchaeota, куда входит Halobacteriaceae).