Создайте выборку из семи аминокислотных последовательностей. Первая последовательность это последовательность Вашего белка, остальные шесть последовательности его гомологов из прокариот.
Постарайтесь, чтобы процент идентичности гомологов с
Вашим белком уменьшался примерно
в такой последовательности: 97%, 9095%, 8590%, 70%, 50%, 40%.
Каждую последовательность сохраните в отдельном файле (в формате FASTA) под
условным номером, например, p1.fasta, ..., p3.fasta, ..., а затем добавьте этот
условный номер к имени последовательности, например, вместо
Составьте выборку генов отобранных Вами белков. Аналогично давайте имена файлам
(g1.fasta, ...) и модифицируйте имена генов, (например, вместо
Следите за тем, чтобы номер белка совпадал с номером его гена! Правильное соответствие белок-ген необходимо для успешного выполнения задания!
Избегайте фрагментов!
Постройте два полных парных выравнивания:
1) выравнивание Вашего белка и его ближайшего гомолога из Вашей выборки
(~97% совпадений);
2) выравнивание их генов.
Исследуйте выравнивания. В отчете надо ответить на следующие вопросы:
Определите процент попарного совпадения последовательностей белков Вашей выборки, а затем процент попарного совпадения последовательностей их генов.
Для определения процента совпадений используйте программу needle с параметрами по умолчанию. Напишите скрипт, позволяющий сразу получить все проценты совпадений. На основе полученных данных постройте график, отображающий искомую зависимость. Образец оформления графика в файле haem.xls на диске Р.
Сравните вид двух графиков: имеющегося в образце и полученного Вами в упр. 3. Опишите ваши выводы в небольшом "сочинении".
Информация: в файле haem.xls находится график, показывающий связь процентов совпадений последовательностей для белка-предшественника гемагглютинина у разных штаммов вируса гриппа: P18875, P13102, P12584, P03454, P26562, P87506. О функциях данного белка можно прочитать , например, в статье Ю.А.Чизмаджева в журнале "Природа" или на сайте "Все о гриппе"