Выравнивание последовательностей

1. Глобальное парное выравнивание гомологичных белков

Из UniProt были скачаны все описанные идентификаторы ECOLI и BASCU, разделением столбцов были получины разные мнемоники и затем с помощью ВПР программы Excel были выписаны все повторяющиеся белки. Для исследования были выбраны белки с мнемониками: 6PGD, 6PGL, ACCA.

Результаты выравнивания приведены в таблице 1, таблицу с идентификаторами можно увидеть здесь.


Protein name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
6-phosphogluconate dehydrogenase, decarboxylating 6PGD_ECOLI 6PGD_BACSU 1718,0 70% 83,4% 3 3
6-phosphogluconolactonase 6PGL_ECOLI 6PGL_BACSU 304,5 25,3% 42% 62 11
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha ACCA_ECOLI ACCA_BACSU 814,5 51,1% 66% 14 4

Таблица 1. Результаты глобального выравнивания

2. Локальное парное выравнивание гомологичных белков


Protein name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
6-phosphogluconate dehydrogenase, decarboxylating 6PGD_ECOLI 6PGD_BACSU 1719 70,1% 83,6% 3 3 99,8% 99,8%
6-phosphogluconolactonase 6PGL_ECOLI 6PGL_BACSU 317 30,6% 48,7% 16 6 76,1% 75,1%
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha ACCA_ECOLI ACCA_BACSU 823,5 53,8% 69,6% 3 2 97,8% 95,1%

Таблица 2. Результаты локального выравнивания

3. Результат применения программ выравнивания к неродственным белкам


Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Needle 66,5 14,2% 23,3% 296 24
Water 86 23,2% 34,1% 65 7 59,8% 49,1%

Таблица 3. Выравнивание неродственных белков

Для выравнивания были выбраны белки TOLA_ECOLI (Tol-Pal system protein TolA) и VMLR_BACSU (Ribosome protection protein VmlR). Как видно из таблицы 3 эти белки действительно негомологичны и небольшие совпадения в последовательностьях являются случайными.

4. Множественное выравнивание белков и импорт в Jalview

Для множественного выравнивания была выбрана мнемоника 6PGD (6-phosphogluconate dehydrogenase, decarboxylating), сеанс поиска по которой выдал 55 белков. Из них были выбраны: 6PGD_HUMAN, 6PGD_ECOLI, 6PGD_RAT, 6PGD_SHEEP, 6PGD1_YEAST, 6PGD_BACSU, 6PGD_MOUSE. Отметив их и нажав Align, мы смоги выровнять эти последовательности, после чего файл с выравниваниями был скачан, переведен в txt формат и открыт в Jalview. Colour>Percentage identity окрасило наше выравнивание по проценту идентичности. В итоге мы получили файл 4tsk.jvp в формате jvp.

В целом белки очень похожи друг на друга. Некоторые участки полностью идентичны (127-132, 183-198). 6PGD_ECOLI и 6PGD_BACSU оказались немного короче остальных и обладают меньшей идетичностью. 6PGD_HUMAN, 6PGD_RAT, 6PGD_SHEEP, 6PGD_MOUSE обладают более чем 90% идентичностью, видимо данный белок почти одинаков у всех млекопитающих.