Выравнивание последовательностей белка

Глобальное парное выравнивание гомологичных белков

В данной части было выполнено глобальное выравнивание последовательностей с одинаковой мнемоникой. Для этого были скачаны все мнемоники двух бактерий, а потом при помощи самостоятельно написанного скрипта на языке Python отобранны одинаковые для обоих оргнизмов. И для трех произвольных пар выполнялось выравнивание функцией needle.

Protein Name ID 1 ID 2 Score Identity (%) Similarity (%) Gaps Indels
6-phosphogluconolactonase файл выравнивания 6PGL_ECOLI 6PGL_BACSU 304.5 25.3% 42% 62 9
Flagellar hook-length control protein файл выравнивания FLIK_ECOLI FLIK_BACSU 129.5 17.3% 29.7% 216 18
ATP-dependent 6-phosphofructokinase isozyme 1 файл выравнивания PFKA_ECOLI PFKA_BACSU 926 55.8% 74.1% 3 3

Локальное парное выравнивание гомологичных белков

Для тех же белков, что и в предыдущей части, было выполнено локальное выравнивание при помощи команды water. Процент покрытия считался вручную.

Protein Name ID 1 ID 2 Score Identity (%) Similarity (%) Gaps Indels Coverage 1 Coverage 2
6-phosphogluconolactonase файл выравнивания 6PGL_ECOLI 6PGL_BACSU 317 30.6% 48.7% 16 3 76.1% 75.1%
Flagellar hook-length control protein файл выравнивания FLIK_ECOLI FLIK_BACSU 144 22.8% 37.6% 102 16 86.9% 78.0%
ATP-dependent 6-phosphofructokinase isozyme 1 файл выравнивания PFKA_ECOLI PFKA_BACSU 928 56.3% 74.8% 1 1 100% 100%

Выравнивания негомологичных последовательностей.

Были взяты две произвольные последовательности, а затем выполнялись выравнивания обеими командами.

Тип выравнивания ID 1 ID 2 Score Identity (%) Similarity (%) Gaps Indels Coverage 1 Coverage 2
Глобальное файл выравнивания ACP_ECOLI CHEA_BACSU 37.5 3.0% 5.3% 598 4
Локальное файл выравнивания ACP_ECOLI CHEA_BACSU 41.5 22.1% 40% 25 4 91.0% 13.9%

Результаты подтверждают то, что данные белки негомологичны, а именно стоит опираться на графу score, в которой можно видеть остаточно малые значения в сравнении с выравниваниями гомологичных белков. Высокое значение покрытия можно отнести к тому, что длина одного белка почти полностью помещается в данном выравнивании, однако покрытие для второго белка рушит все предположения о близкородственности белков.. Также стоит отметить, что локальное выравнивание основывается на отдельных частях, а не целых последовательностях, поэтому могли получиться такие, достаточно немалые, проценты для Identity и Similarity.

Множественное выравниваие последовательностей.

Для данной части задания была выбрана мнемоника PFKA- белка участвующего в гликолизе. Для этого сначала скачались все имена таких последовательностей из базы данных (их оказалось 276), а потом были выбраны 7 произвольных имен. Затем эти имена были загружены с добавлением соответствующих белков ECOLI и BACSU в программу Jalview следующей командой: "PFKA_HAEPS or PFKA_CITK8 or PFKA_ACTPJ or PFKA_CLOB6 or PFKA_LACP3 or PFKA_WOLSU or PFKA_MYCGE or PFKA_ECOLI or PFKA_BACSU". После этого были выполнены выравнивания различными способами, чтобы удостовериться, что на малой выборке все из них одинавково эффективны. Далее можно увидеть результат выравнивани:

Выравнивание

Файл с проектом файл

Заметим, что белки выровнялись достаточно хорошо. Можно отметить также то, что данный белок является достаточно консервативным, хоть и выбранные случайным образом имена принадлежали различным бактериям. Выполненное выравнивание полностью подтверждает то, что эти белки гомологичны, и различия в них очень малы, при чем почти каждое различие затрагивает все белки (то есть в этой позиции различаются все последовательности).