Практикум 9: Выравнивание гомологичных белков

Бессонницына Анастасия Сергеевна
1 курс Факультета биоинженерии и биоинформатики
Московский Государственный Университет имени М.В.Ломоносова

1. Глобальное парное выравнивание гомологичных белков

Для того чтобы провести серию глобальных выравниваний, я отобрала пары последовательностей с одинаковой мнемоникой у кишечной и сенной палочек с помощью возможностей гугл-таблиц. Далее с помощью программы needle я выровняла последовательности и получила следующие результаты:

Protein Name ID 1 ID 2 Score Identity Similarity Gaps Indels
Putative aliphatic sulfonates transport permease protein SsuC SSUC_ECOLI SSUC_BACSU 609.5 43.0% 61.3% 29 4
D-methionine transport system permease protein MetI METI_ECOLI METI_BACSU 20.0 4.9% 8.6% 436 10
ATP synthase subunit a ATP6_ECOLI ATP6_BACSU 260.0 27.6% 45.8% 79 13

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков

2. Локальное парное выравнивание гомологичных белков

Затем для тех же пар трёх белков с помощью программы water была проведена серия локальных выравниваний и получены следующие результаты:

Protein Name ID 1 ID 2 Score Identity Similarity Gaps Indels Coverage 1 Coverage 2
Putative aliphatic sulfonates transport permease protein SsuC SSUC_ECOLI SSUC_BACSU 617.0 49.2% 69.6% 0 0 91.3% 86.9%
D-methionine transport system permease protein MetI METI_ECOLI METI_BACSU 35.0 53.8% 92.3% 1 1 5.9% 3.2%
ATP synthase subunit a ATP6_ECOLI ATP6_BACSU 265.0 29.8% 50.0% 53 11 85.6% 94.7%

Таблица 2. Характеристики локального парного выравнивания трёх пар белков

3. Комментарии к выравниваниям

SsuC (Putative aliphatic sulfonates transport permease protein SsuC)

Данные белки вполне можно назвать гомологичными, так как при глобальном выравнивании показатели идентичности и сходства оказались достаточно большими, и количество инделей и гэпов тоже в рамках допустимого для того чтобы выдвинуть предположение о гомологии. Локальное выравнивание в данном случае информативно, но по факту не даёт так много информации, как глобальное.

MetI (D-methionine transport system permease protein MetI)

Гомология очень маловероятна, потому что показатели идентичности и сходства очень низкие, а также достаточно много гэпов и инделей. Вероятнее всего, программа в попытке выровнять последовательности по всей длине просто растягивает последовательности за счёт добавления большого количества гэпов и инделей. Однако у данной пары белков почти наверняка есть гомологичные участки, так как показатели идентичности, а тем более сходства, очень высокие, а инделей и гэпов очень мало. Но этот участок довольно маленький, так как покрывает менее 6% у обеих последовательностей. Локальное выравнивание в данном случае информативно, потому что именно благодаря ему удаётся обнаружить гомологию. Пары букв, сопоставленные в локальном выравнивании, не сопоставлены корректно в глобальном, потому что глобальный алгоритм вынужден выравнивать последовательности по всей длине и вставляет огромное число гэпов, тем самым разрывая консервативный участок.

Atp6 (ATP synthase subunit a)

Гомология под сомнением. Показатели идентичности и сходства средние, но ближе к гомологичным, поэтому предположить гомологию можно, но вероятно эти последовательности — довольно дальние гомологи, и для большей уверенности необходим дополнительный анализ. Гомологичные участки наверняка есть, так как полученные при локальном выравнивании участки достаточно схожи и составляют большую долю в обеих последовательностях. В данном случае локальное выравнивание информативно, но менее информативно, чем в двух предыдущих, так как по большей части повторяет глобальное.

4. Результат применения программ выравнивания к неродственным белкам

Для проверки были взяты заведомо неродственные белки: Medium/long-chain acyl-CoA thioesterase YigI (YIGI_ECOLI) и DNA-3-methyladenine glycosylase (3MGA_BACSU).

Глобальное выравнивание

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
1) Medium/long-chain acyl-CoA thioesterase YigI
2) DNA-3-methyladenine glycosylase
YIGI_ECOLI 3MGA_BACSU 18.5 3.4% 8.1% 312 4

Таблица 3. Характеристики глобального парного выравнивания неродственной пары белков

Локальное выравнивание

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
1) Medium/long-chain acyl-CoA thioesterase YigI
2) DNA-3-methyladenine glycosylase
YIGI_ECOLI 3MGA_BACSU 26.5 20.8% 41.7% 8 1 30.9% 13.2%

Таблица 4. Характеристики локального парного выравнивания неродственной пары белков

В данном случае белки, как можно было предположить, имеют низкие показатели как в глобальном, так и в локальном выравнивании. Из чего можно вполне уверенно заявить об их негомологичности. Это согласуется с тем, что данные последовательности выбирались случайным образом.

5. Множественное выравнивание белков и импорт в Jalview

Для множественного выравнивания я выбрала мнемонику ATP6 (ATP synthase subunit a). С помощью расширенного поиска в UniProtKB я нашла другие записи с такой же мнемоникой в базе Swiss-Prot.

Запрос: (id:ATP6_*) AND (reviewed:true)

По данному запросу было найдено 604 белка, из которых были выбраны следующие пять: ATP6_HUMAN, ATP6_BOVIN, ATP6_DROME, ATP6_YEAST, ATP6_YARLI. Затем в Jalview с помощью программы Mafft было выполнено множественное выравнивание.

проект Jalview

Уровень консервативности полученного выравнивания — средний. В нём присутствуют довольно консервативные участки, например: 141–149, 198–241, 283–294. Тем не менее, на мой взгляд, не все последовательности выровнялись хорошо. Так, последовательности ECOLI, BACSU и DROME выровнялись хуже остальных. Несмотря на это, я считаю, что все белки в данном выравнивании являются гомологами, хотя, возможно, и не самыми близкими.