В данной части было выполнено глобальное выравнивание последовательностей с одинаковой мнемоникой. Для этого были скачаны все мнемоники двух бактерий, а потом при помощи самостоятельно написанного скрипта на языке Python отобранны одинаковые для обоих оргнизмов. И для трех произвольных пар выполнялось выравнивание функцией needle.
Protein Name | ID 1 | ID 2 | Score | Identity (%) | Similarity (%) | Gaps | Indels |
6-phosphogluconolactonase файл выравнивания | 6PGL_ECOLI | 6PGL_BACSU | 304.5 | 25.3% | 42% | 62 | 9 |
Flagellar hook-length control protein файл выравнивания | FLIK_ECOLI | FLIK_BACSU | 129.5 | 17.3% | 29.7% | 216 | 18 |
ATP-dependent 6-phosphofructokinase isozyme 1 файл выравнивания | PFKA_ECOLI | PFKA_BACSU | 926 | 55.8% | 74.1% | 3 | 3 |
Для тех же белков, что и в предыдущей части, было выполнено локальное выравнивание при помощи команды water. Процент покрытия считался вручную.
Protein Name | ID 1 | ID 2 | Score | Identity (%) | Similarity (%) | Gaps | Indels | Coverage 1 | Coverage 2 |
6-phosphogluconolactonase файл выравнивания | 6PGL_ECOLI | 6PGL_BACSU | 317 | 30.6% | 48.7% | 16 | 3 | 76.1% | 75.1% |
Flagellar hook-length control protein файл выравнивания | FLIK_ECOLI | FLIK_BACSU | 144 | 22.8% | 37.6% | 102 | 16 | 86.9% | 78.0% |
ATP-dependent 6-phosphofructokinase isozyme 1 файл выравнивания | PFKA_ECOLI | PFKA_BACSU | 928 | 56.3% | 74.8% | 1 | 1 | 100% | 100% |
Были взяты две произвольные последовательности, а затем выполнялись выравнивания обеими командами.
Тип выравнивания | ID 1 | ID 2 | Score | Identity (%) | Similarity (%) | Gaps | Indels | Coverage 1 | Coverage 2 |
Глобальное файл выравнивания | ACP_ECOLI | CHEA_BACSU | 37.5 | 3.0% | 5.3% | 598 | 4 | ||
Локальное файл выравнивания | ACP_ECOLI | CHEA_BACSU | 41.5 | 22.1% | 40% | 25 | 4 | 91.0% | 13.9% |
Результаты подтверждают то, что данные белки негомологичны, а именно стоит опираться на графу score, в которой можно видеть остаточно малые значения в сравнении с выравниваниями гомологичных белков. Высокое значение покрытия можно отнести к тому, что длина одного белка почти полностью помещается в данном выравнивании, однако покрытие для второго белка рушит все предположения о близкородственности белков.. Также стоит отметить, что локальное выравнивание основывается на отдельных частях, а не целых последовательностях, поэтому могли получиться такие, достаточно немалые, проценты для Identity и Similarity.
Для данной части задания была выбрана мнемоника PFKA- белка участвующего в гликолизе. Для этого сначала скачались все имена таких последовательностей из базы данных (их оказалось 276), а потом были выбраны 7 произвольных имен. Затем эти имена были загружены с добавлением соответствующих белков ECOLI и BACSU в программу Jalview следующей командой: "PFKA_HAEPS or PFKA_CITK8 or PFKA_ACTPJ or PFKA_CLOB6 or PFKA_LACP3 or PFKA_WOLSU or PFKA_MYCGE or PFKA_ECOLI or PFKA_BACSU". После этого были выполнены выравнивания различными способами, чтобы удостовериться, что на малой выборке все из них одинавково эффективны. Далее можно увидеть результат выравнивани:
Файл с проектом файл
Заметим, что белки выровнялись достаточно хорошо. Можно отметить также то, что данный белок является достаточно консервативным, хоть и выбранные случайным образом имена принадлежали различным бактериям. Выполненное выравнивание полностью подтверждает то, что эти белки гомологичны, и различия в них очень малы, при чем почти каждое различие затрагивает все белки (то есть в этой позиции различаются все последовательности).