Занятие 10. Cравнение аминокислотных последовательностей белков и нуклеотидных последовательностей соответствующих генов.

  1. Создание двух выборок — выборки белков и выборки их генов.

    Создайте выборку из семи аминокислотных последовательностей. Первая последовательность — это последовательность Вашего белка, остальные шесть — последовательности его гомологов из прокариот.

    Постарайтесь, чтобы процент идентичности гомологов с Вашим белком уменьшался примерно в такой последовательности: 97%, 90–95%, 85–90%, 70%, 50%, 40%. Каждую последовательность сохраните в отдельном файле (в формате FASTA) под условным номером, например, p1.fasta, ..., p3.fasta, ..., а затем добавьте этот условный номер к имени последовательности, например, вместо ">uniprot|P18875...." сделайте ">р1 uniprot|P18875....".

    Составьте выборку генов отобранных Вами белков. Аналогично давайте имена файлам (g1.fasta, ...) и модифицируйте имена генов, (например, вместо ">emblcds|D10477...." сделайте ">g5 emblcds|D10477....").

    Следите за тем, чтобы номер белка совпадал с номером его гена! Правильное соответствие белок-ген необходимо для успешного выполнения задания!

    Избегайте фрагментов!

     

  2. Наблюдение элементарных эволюционных событий в ближайших гомологах

    Постройте два полных парных выравнивания:
    1) выравнивание Вашего белка и его ближайшего гомолога из Вашей выборки (~97% совпадений);
    2) выравнивание их генов.
    Исследуйте выравнивания. В отчете надо ответить на следующие вопросы:

    1. Какие элементарные эволюционные события повлекли за собой аминокислотные замены? Отдельно опишите каждый случай, используя стандартный генетический код.
    2. Сколько случаев синонимичных замен Вы наблюдаете? Сколько из них произошли в третьих позициях кодонов? Отдельно опишите остальные случаи.
    3. Каково соотношение синонимичных и несинонимичных замен нуклеотидов?
    4. Составьте "матрицу замен" нуклеотидов: какие замены наблюдаются и в каком количестве.
    Примечание. Если ваш белок длиннее 300 остатков, или ближайший гомолог оказался не слишком близким (<95% совпадений), то можно ограничиться фрагментом белкового выравнивания, включающим пять аминокислотных замен, и соответствующим фрагментом гена.
     
  3. Исследование зависимости процента совпадений последовательностей белков от процента совпадений последовательностей их генов.

    Определите процент попарного совпадения последовательностей белков Вашей выборки, а затем процент попарного совпадения последовательностей их генов.

    Для определения процента совпадений используйте программу needle с параметрами по умолчанию. Напишите скрипт, позволяющий сразу получить все проценты совпадений. На основе полученных данных постройте график, отображающий искомую зависимость. Образец оформления графика — в файле haem.xls на диске Р.

    Сравните вид двух графиков: имеющегося в образце и полученного Вами в упр. 3. Опишите ваши выводы в небольшом "сочинении".

    Информация: в файле haem.xls находится график, показывающий связь процентов совпадений последовательностей для белка-предшественника гемагглютинина у разных штаммов вируса гриппа: P18875, P13102, P12584, P03454, P26562, P87506. О функциях данного белка можно прочитать , например, в статье Ю.А.Чизмаджева в журнале "Природа" или на сайте "Все о гриппе"

См. также подсказку.