Занятие 10. Cравнение аминокислотных последовательностей белков и нуклеотидных последовательностей соответствующих генов.

Создание двух выборок — выборки белков и выборки их генов.
Создайте выборку из семи аминокислотных последовательностей. Первая последовательность — это последовательность Вашего белка, остальные шесть — последовательности его гомологов из прокариот.
Постарайтесь, чтобы процент идентичности гомологов с Вашим белком уменьшался примерно в такой последовательности: 97%, 90–95%, 85–90%, 70%, 50%, 40%. Каждую последовательность сохраните в отдельном файле (в формате FASTA) под условным номером, например, p1.fasta, ..., p3.fasta, ..., а затем добавьте этот условный номер к имени последовательности, например, вместо ">uniprot|P18875...." сделайте ">р1 uniprot|P18875....".
Составьте выборку генов отобранных Вами белков. Аналогично давайте имена файлам (g1.fasta, ...) и модифицируйте имена генов, (например, вместо ">emblcds|D10477...." сделайте ">g5 emblcds|D10477....").
Следите за тем, чтобы номер белка совпадал с номером его гена! Правильное соответствие белок-ген необходимо для успешного выполнения задания!
Избегайте фрагментов!
Наблюдение элементарных эволюционных событий в ближайших гомологах
Постройте два полных парных выравнивания:
1) выравнивание Вашего белка и его ближайшего гомолога из Вашей выборки (~97% совпадений);
2) выравнивание их генов.
Исследуйте выравнивания. В отчете надо ответить на следующие вопросы:
1. Какие элементарные эволюционные события повлекли за собой аминокислотные замены? Отдельно опишите каждый случай, используя стандартный генетический код.
2. Сколько случаев синонимичных замен Вы наблюдаете? Сколько из них произошли в третьих позициях кодонов? Отдельно опишите остальные случаи.
3. Каково соотношение синонимичных и несинонимичных замен нуклеотидов?
4. Составьте "матрицу замен" нуклеотидов: какие замены наблюдаются и в каком количестве.
Примечание. Если ваш белок длиннее 300 остатков, или ближайший гомолог оказался не слишком близким (<95% совпадений), то можно ограничиться фрагментом белкового выравнивания, включающим пять аминокислотных замен, и соответствующим фрагментом гена.
Исследование зависимости процента совпадений последовательностей белков от процента совпадений последовательностей их генов.
Определите процент попарного совпадения последовательностей белков Вашей выборки, а затем процент попарного совпадения последовательностей их генов.
Для определения процента совпадений используйте программу needle с параметрами по умолчанию. Напишите скрипт, позволяющий сразу получить все проценты совпадений. На основе полученных данных постройте график, отображающий искомую зависимость. Образец оформления графика — в файле haem.xls на диске Р.
Сравните вид двух графиков: имеющегося в образце и полученного Вами в упр. 3. Опишите ваши выводы в небольшом "сочинении".
Информация: в файле haem.xls находится график, показывающий связь процентов совпадений последовательностей для белка-предшественника гемагглютинина у разных штаммов вируса гриппа: P18875, P13102, P12584, P03454, P26562, P87506. О функциях данного белка можно прочитать , например, в статье Ю.А.Чизмаджева в журнале "Природа" или на сайте "Все о гриппе"

См. также подсказку.