Практикум №9. Выравнивание последовательностей

2. Глобальное парное выравнивание гомологичных белков

Были выбраны пары белков для двух бактреий Escherichia coli и Bacillus subtilis, чьи идентификаторы Swiss-Prot имеют одинаковую мнемонику функции. Выбранные белки: Farnesyl diphosphate synthase, 2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase и 4-diphosphocytidyl-2-C-methyl-D-erythritol kinase.

Protein name ID1 ID2 Score Identity Similarity Gaps Indels
Farnesyl diphosphate synthase ISPA_ECOLI ISPA_BACSU 525.0 37.5% 49.5% 55 4
2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase ISPD_ECOLI ISPD_BACSU 324.0 33.2% 53.1% 80 6
4-diphosphocytidyl-2-C-methyl-D-erythritol kinase ISPE_ECOLI ISPE_BACSU 295.0 27.6% 43.8% 89 13

3. Локальное парное выравнивание гомологичных белков

Protein name ID1 ID2 Score Identity Similarity Gaps Indels Coverage1 Coverage2
Farnesyl diphosphate synthase ISPA_ECOLI ISPA_BACSU 528.0 44.9% 58.9% 4 2 88.3% 87.8%
2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase ISPD_ECOLI ISPD_BACSU 332.0 36.5% 56.6% 9 5 90.3% 92.2%
4-diphosphocytidyl-2-C-methyl-D-erythritol kinase ISPE_ECOLI ISPE_BACSU 306.5 29.8% 46.2% 58 11 94.7% 94.1%

4. Комментарии к выравниваниям

По результатам выравнивания все белки оказались гомологичными. Об этом можно судить по показателям Identity и Similarity. Высокие проценты покрытия локального выравнивания говорят о том, что их сходство скорее всего наблюдается по всей длинне.

Однако некоторые показаетли при выравнивании белоков с мнемоникой ISPE отличались от двух предыдущих. Так, их локальное выравниевание имеет 58 гэпов, что значительно превышает данные значения для двух предыдущих пар. Показатель Identity оказался достаточно низким в обоих выравниваниях.

При визуальном анализе выравниваний можно отметить, что в глобальных и локальных выравниваниях белков с мнемониками ISPA и ISPD индели небольшие и равномерно распределены по последовательностям. В выравниваниях белков с мнемоникой ISPE наблюдается смещение инделей во вторую половину выравненных последовательностей, а так же увеличение их длин. Так, наиболее длинный индель в последовательности ISPE_ECOLI противопоставлен 217 - 237 а.о. белка ISPE_BACSU в глобальном выравнивании, полученном с помощью needle. Такие результаты могли получиться в результате глобальных генетических перестроек. Из-за них некоторые участки гомологичных белков могли стать негомологичными, что объясняет наблюдаемые отличия.

5. Результат применения программ выравнивания к неродственным белкам

Тип выравнивания ID1 ID2 Score Identity Similarity Gaps Indels Coverage1 Coverage2
Глобальное ILVX_ECOLI IF1_BACSU 13.0 4.2% 9.7% 56 2 - -
Локальное ILVX_ECOLI IF1_BACSU 13.0 37.5% 50.0% 0 0 43,8% 9,7%

Данные глобального выравнивания свидетельствуют о негомологичности выбранных белков. Показатели Identity и Similarity не превышают 20%. Также данное выравнивание обладает большим количеством гэпов (56), при этом инделей всего 2.

Значения Identity и Similarity локального выравнивания неродственных белков оказались достаточно высокими. Однако стоит обратить внимание на покрытие белков в выравнивании: Coverage1 = 43,8% Coverage2 = 9,7%. Зная длины белков (ILVX_ECOLI: 16 а.о. и IF1_BACSU: 72 а.о.) можно предположить, что 7 а.о. второго короткого белка были выровнены со схожим участком первого длинного белка. В таком случае локальное выравнивание доказывает их негомологичность.

6. Множественное выравнивание белков и импорт в Jalview

Для выполнения задания была выбрана мнемоника ISPA, полное имя белка из ECOLI: Farnesyl diphosphate synthase. Для поиска всех белков, чьи идентификаторы начинаются с этой мнемоники в расширенном поиске UniPort был задан следующий запрос: (id:ISPA_*).

В результате поиска были найдены 12 записей. Для выполнения множественного выравнивания были выбраны: ISPA_AQUAE, ISPA_HAEIN, ISPA_GEOSE, ISPA_BRADU, ISPA_SINFN.

Выравнивание проводилось на сайте UniPort, после чего был скачан файлс выравниванием в FASTA-формате и открыт в Jalviewg. Колонки выравнивания были раскрашены по проценту идентичности.

Файл с проектом Jalview

По результатам множественного выравнивания можно сделать вывод о том, что выбранные белки являются гомологичными. Однако выравнивание не является одинаково хорошим для всех белков на всей длине. На участке с 1 по 27 столбец аминокислоты присутствуют лишь у 2 из 7 белков. На месте остальных последовательностей располагаются индели. Регион, наиболее выделенный при окраске по процентам идентичности, находится с 102 по 147 столбец.

В целом, выравнивание является не до конца однородным. Среди него можно выделить более и менее консервативные участки. Это может говорить о структурно-функциональных особенностях белка. Участки, наиболее важные, будут оставаться неизменными. А неспецифические области не будут подвержены стабилизирующему отбору.