В этом разделе требовалось выполнить глобальное парное выравнивание белковых последовательностей. Для этого мною были выбраны три пары белков, чьи идентификаторы Swiss-Prot имеют одинаковую мнемонику функции. Пары с совпадающими мнемониками были определены с помощью стандартных консольных программ GNU/Linux. Результаты выравнивания приведены в таюлице 1.
Protein Name | ID1 | ID2 | Score | %Identity | %Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|
Acyl carrier protein | ACP_ECOLI | ACP_BACSU | 216.0 | 60.3 | 71.8 | 1 | 1 |
Dihydrofolate reductase | DYR_ECOLI | DYR_BACSU | 359.0 | 41.7 | 60.7 | 9 | 2 |
Hexuronate transporter | EXUT_ECOLI | EXUT_BACSU | 352.5 | 24.0 | 43.6 | 36 | 11 |
Ниже вы можете увидеть результаты локального парного выравнивания тех же последовательностей при параметрах по умолчанию (Таблица 2).
Protein Name | ID1 | ID2 | Score | %Identity | %Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
Acyl carrier protein | ACP_ECOLI | ACP_BACSU | 216.0 | 61.0 | 72.7 | 0 | 0 | 98.7% | 100% |
Dihydrofolate reductase | DYR_ECOLI | DYR_BACSU | 359.0 | 43.8 | 63.8 | 1 | 1 | 100% | 95.2% |
Hexuronate transporter | EXUT_ECOLI | EXUT_BACSU | 367.5 | 24.9 | 45.3 | 23 | 6 | 94.2% | 95.7% |
В этом разделе предлагалось сравнить негомологичные последовательности. Мне стало интересно, насколько схожи белки, принадлежащие разным классам ферментов. Для этого были взяты следующие ферменты: Sulfoquinovose isomerase из Escherichia coli (strain K12), относящаяся к изомеразам, и L-lactate dehydrogenase из Bacillus subtilis, относящаяся к дегидрогеназам. В полученных выравниваниях (таблица 3) наблюдается относительно высокое количество гэпов и инделей, а также небольшая величина покрытия, что подтверждает негомологичность последовательностей. Однако процент схожести может говорить о наличии какой-то эволюционной связи между белками. Вероятно, это связано с тем, что они относятся к одной функциональной группе.
Alignment | Protein Name 1 | Protein Name 2 | ID 1 | ID 2 | %Identity | %Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|---|
local | Sulfoquinovose isomerase | L-lactate dehydrogenase | SQUS_ECOLI | LDH_BACSU | 18.9 | 32.6 | 61 | 18 | 43.3 | 43.8 |
global | Sulfoquinovose isomerase | L-lactate dehydrogenase | SQUS_ECOLI | LDH_BACSU | 14.4 | 25.0 | 227 | 10 | - | - |
Для выполнения множественного выравнивания были взяты белки с мнемоникой ACP (рекомендованное название - Acyl carrier protein) . Всего в UniProtKB по данному запросу нашлось 546 записей.
Выбранные для анализа белки:
ACP_ECOLI - Escherichia coli - гамма-протеобактерии
ACP_BACSU - Bacillus subtilis - фирмикуты
ACP_LEUMU - Leucothrix mucor - гамма-протеобактерия
ACP_OCELI - Oceanospirillum linum - гамма-протеобактерия
ACP_MYXXA - Myxococcus xanthus - Дельта-протеобактерия
ACP_AZOBR - Azospirillum brasilense - Альфа-протеобактерия
ACP_ANAVA - Anabaena variabilis - цианобактерия
Алгоритм множественного выравнивания был запущен непосредственно в Jalview. Итоговый файл можно посмотретьздесь.
Мы видим, что белки действительно гомологичны, так как во всех последовательностях имеются наиболее консервативные позиции 52, 73, 32-33, 36-37, 40-41, 61, 69-70, а также малое число гэпов. Однако ацилпереносящие белки Myxococcus xanthus и Anabaena variabilis сильно отличаются от остальных гомологов. Это можно объяснить близким родством всех оставшихся организмов, последовательности которых практически полностью заполнены менее консервативными участками. Более подробно различия отражены на дереве (Рис. 2).
В данном разделе произведено выравнивание белка из предыдущего практикума с его гомологом. Поиск последнего осуществлен с помощью BLAST. Им оказался белок с полным названием 2,3-дикето-5-метилтиопентил-1-фосфат енолаза из Bacillus cereus. Результаты выравнивания представлены в таблице 4.
Высокий процент идентичности, почти 100%-ное покрытие и малое количество гэпов подтверждают гомологичность последовательностей.
Тип выравнивания | ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
Глобальное | MTNW_GEOKA | MTNW_BACCR | 1392.5 | 64.2 | 78.1 | 5 | 3 | - | - |
Локальное | MTNW_GEOKA | MTNW_BACCR | 1393.5 | 65.2 | 79.4 | 3 | 2 | 98.5 | 98.1% |
В этом разделе нужно было поэкспериментировать с параметрами программ needle и water. При введении команды без автозаполнения программа запрашивает значения следующих параметров: gap opening penalty (штраф за открытие гэпа, по умолчанию 10.0), gap extension penalty (штраф за расщирение гэпа, по умолчанию 0.5). Результаты выравниваний гомологов из предыдущего раздела (ID1 - MTNW_GEOKA, ID2 - MTNW_BACCR) с измененными параметрами представлены в таблице 5.
Gap opening penalty | Gap extension penalty | Score | % Identity | % Similarity | Gaps | Indels | % Coverage 1 | % Coverage 2 |
---|---|---|---|---|---|---|---|---|
Глобальное выравнивание | ||||||||
1.0 | 0.1 | 1464.8 | 63.7 | 74.9 | 49 | 29 | - | - |
20.0 | 2.0 | 1371.0 | 64.2 | 78.1 | 5 | 3 | - | - |
20.0 | 0.1 | 1372.9 | 64.2 | 78.1 | 5 | 3 | - | - |
1.0 | 2.0 | 1448.0 | 64.6 | 77.7 | 25 | 23 | - | - |
Локальное выравнивание | ||||||||
1.0 | 0.1 | 1465.8 | 63.7 | 74.9 | 51 | 29 | 99.8 | 99.8 |
20.0 | 2.0 | 1372.0 | 66.9 | 81.5 | 1 | 1 | 94.2 | 94.2 |
20.0 | 0.1 | 1373.9 | 65.2 | 79.4 | 3 | 2 | 98.5 | 98.1 |
1.0 | 2.0 | 1451.0 | 64.7 | 77.9 | 25 | 21 | 99.8 | 99.8 |