Выравнивание последовательностей белков


Глобальное парное выравнивание гомологичных белков

В этом разделе требовалось выполнить глобальное парное выравнивание белковых последовательностей. Для этого мною были выбраны три пары белков, чьи идентификаторы Swiss-Prot имеют одинаковую мнемонику функции. Пары с совпадающими мнемониками были определены с помощью стандартных консольных программ GNU/Linux. Результаты выравнивания приведены в таюлице 1.

Таблица 1. Глобальное парное выравнивание.
Protein NameID1ID2Score%Identity%SimilarityGapsIndels
Acyl carrier proteinACP_ECOLIACP_BACSU216.060.371.811
Dihydrofolate reductaseDYR_ECOLIDYR_BACSU359.041.760.792
Hexuronate transporterEXUT_ECOLIEXUT_BACSU352.524.043.63611

Локальное парное выравнивание гомологичных белков

Ниже вы можете увидеть результаты локального парного выравнивания тех же последовательностей при параметрах по умолчанию (Таблица 2).

Таблица 2. Локальное парное выравнивание.
Protein NameID1ID2Score%Identity%SimilarityGapsIndelsCoverage 1Coverage 2
Acyl carrier proteinACP_ECOLIACP_BACSU216.061.072.70098.7%100%
Dihydrofolate reductaseDYR_ECOLIDYR_BACSU359.043.863.811100%95.2%
Hexuronate transporterEXUT_ECOLIEXUT_BACSU367.524.945.323694.2%95.7%

Результат применения программ выравнивания к неродственным белкам

В этом разделе предлагалось сравнить негомологичные последовательности. Мне стало интересно, насколько схожи белки, принадлежащие разным классам ферментов. Для этого были взяты следующие ферменты: Sulfoquinovose isomerase из Escherichia coli (strain K12), относящаяся к изомеразам, и L-lactate dehydrogenase из Bacillus subtilis, относящаяся к дегидрогеназам. В полученных выравниваниях (таблица 3) наблюдается относительно высокое количество гэпов и инделей, а также небольшая величина покрытия, что подтверждает негомологичность последовательностей. Однако процент схожести может говорить о наличии какой-то эволюционной связи между белками. Вероятно, это связано с тем, что они относятся к одной функциональной группе.

Таблица 3. Результат применения программ выравнивания к неродственным белкам
AlignmentProtein Name 1Protein Name 2ID 1ID 2%Identity%SimilarityGapsIndelsCoverage 1Coverage 2
localSulfoquinovose isomeraseL-lactate dehydrogenaseSQUS_ECOLILDH_BACSU18.932.6611843.343.8
globalSulfoquinovose isomeraseL-lactate dehydrogenaseSQUS_ECOLILDH_BACSU14.425.022710--

Множественное выравнивание белков и импорт в Jalview

Для выполнения множественного выравнивания были взяты белки с мнемоникой ACP (рекомендованное название - Acyl carrier protein) . Всего в UniProtKB по данному запросу нашлось 546 записей.

Выбранные для анализа белки:

ACP_ECOLI - Escherichia coli - гамма-протеобактерии

ACP_BACSU - Bacillus subtilis - фирмикуты

ACP_LEUMU - Leucothrix mucor - гамма-протеобактерия

ACP_OCELI - Oceanospirillum linum - гамма-протеобактерия

ACP_MYXXA - Myxococcus xanthus - Дельта-протеобактерия

ACP_AZOBR - Azospirillum brasilense - Альфа-протеобактерия

ACP_ANAVA - Anabaena variabilis - цианобактерия

Алгоритм множественного выравнивания был запущен непосредственно в Jalview. Итоговый файл можно посмотретьздесь.

Рис. 1. Выравнивание в Jalview.


Рис. 2. Дерево Neighbor-joining

Мы видим, что белки действительно гомологичны, так как во всех последовательностях имеются наиболее консервативные позиции 52, 73, 32-33, 36-37, 40-41, 61, 69-70, а также малое число гэпов. Однако ацилпереносящие белки Myxococcus xanthus и Anabaena variabilis сильно отличаются от остальных гомологов. Это можно объяснить близким родством всех оставшихся организмов, последовательности которых практически полностью заполнены менее консервативными участками. Более подробно различия отражены на дереве (Рис. 2).


Выравнивание своего белка с его гомологом

В данном разделе произведено выравнивание белка из предыдущего практикума с его гомологом. Поиск последнего осуществлен с помощью BLAST. Им оказался белок с полным названием 2,3-дикето-5-метилтиопентил-1-фосфат енолаза из Bacillus cereus. Результаты выравнивания представлены в таблице 4.

Высокий процент идентичности, почти 100%-ное покрытие и малое количество гэпов подтверждают гомологичность последовательностей.




Таблица 4. Выравнивание белка с гомологом
Тип выравниванияID1ID2Score% Identity% SimilarityGapsIndelsCoverage 1Coverage 2
ГлобальноеMTNW_GEOKAMTNW_BACCR1392.564.278.153--
ЛокальноеMTNW_GEOKAMTNW_BACCR1393.565.279.43298.598.1%

Параметры программ needle и water

В этом разделе нужно было поэкспериментировать с параметрами программ needle и water. При введении команды без автозаполнения программа запрашивает значения следующих параметров: gap opening penalty (штраф за открытие гэпа, по умолчанию 10.0), gap extension penalty (штраф за расщирение гэпа, по умолчанию 0.5). Результаты выравниваний гомологов из предыдущего раздела (ID1 - MTNW_GEOKA, ID2 - MTNW_BACCR) с измененными параметрами представлены в таблице 5.

Таблица 5. Параметры needle и water
Gap opening penaltyGap extension penaltyScore% Identity% SimilarityGapsIndels% Coverage 1% Coverage 2
Глобальное выравнивание
1.00.11464.863.774.94929--
20.02.01371.064.278.153--
20.00.11372.964.278.153--
1.02.01448.064.677.72523--
Локальное выравнивание
1.00.11465.863.774.9512999.899.8
20.02.01372.066.981.51194.294.2
20.00.11373.965.279.43298.598.1
1.02.01451.064.777.9252199.899.8