Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2014

Занятие 2. Реконструкция филогении

Отчёт по первому заданию присоединяйте к отчёту по предыдущему практикуму, он должен быть готов к 26 февраля.

Письменные отчёты по заданиям 2–6 не требуются, вы будете их "защищать" на четвёртом занятии.

Заведите в правильном месте рабочую директорию. Все файлы, относящиеся к заданию, храните там, они понадобятся вам при "защите".

 

  1. Пользуясь таксономическим сервисом NCBI: http://www.ncbi.nlm.nih.gov/taxonomy/, определите, к каким таксонам относятся отобранные вами бактерии. Какие нетривиальные ветви на дереве отобранных бактерий выделяют какие-нибудь из таксонов? (укажите в отчёте ветви и таксоны).

  2. Из списка функций белков выберите одну: по белкам соответствующего семейства вы будете реконструировать филогенетическое дерево.

Функция

Мнемоника

Фактор элонгации трансляции Ts

EFTS

Фактор высвобождения пептидной цепи 1

RF1

Рибосомный белок L1

RL1

Рибосомный белок L2

RL2

Рибосомный белок S2

RS2

Рибосомный белок S4

RS4

Пептидил-тРНК гидролаза

PTH

16S рРНК-метилтрансфераза H

RSMH

Энолаза

ENO

  1. Получите из Swiss-Prot последовательности белков с данной функцией из отобранных вами бактерий и выровняйте их.

Подсказка: запустите JalView. В меню File выберите Fetch sequences. Щёлкните по "Select Database" и выберите Uniprot. Запишите через точку с запятой выражения вида xxxx_yyyyy, где xxxx – выбранная вами мнемоника функции, а yyyyy – мнемоники отобранных вами организмов. После нажатия OK должно появиться окно с последовательностями. В этом окне выберите Web Service → Alignment → любая программа (например Muscle).

Альтернативный вариант [ДД]: Для любителей дискретных шагов (вроде меня). 1) Составьте список идентификаторов белков по схеме как выше (например, CRP_ECOLI, CRP_SALTY, CRP_SHIFL). 2) Вставьте список в форму загрузки из Uniprot и найдите белки. Дальше их можно скачать кнопкой "Download" и сохранить. 3) Построить выравнивание можно с помощью сервера Muscle. Действуя так, легче выполнить и следующий пункт, поскольку отредактировать имена последовательностей можно прямо в текстовом формате (до или после построения выравнивания).

  1. В окне с выравниванием оставьте от названия каждого белка только мнемонику вида (так легче будет сравнивать деревья: правой кнопкой мыши по имени, выбираем верхний пункт меню, затем "Edit..."). Реконструируйте дерево методом "Neighbor Joining Using % Identity".
  2. Сохраните: а) проект JalView (jar-файл); б) выравнивание в fasta-формате (с расширением "fasta"); в) дерево в Newick-формате. К 4 марта будьте готовы: а) открыть проект в JalView; б) открыть дерево в MEGA; в) указать на дереве все нетривиальные ветви; г) объяснить, отличается ли дерево по топологии от правильного (построенного при выполнении предыдущего задания) – если да, то чем; если нет, то почему вы в этом уверены.

  3. Также будьте готовы (для этого нужно эти действия хотя бы раз проделать): а) открыть выравнивание в MEGA (методом "Analyze"); б) реконструировать дерево в MEGA указанным методом (ML, ME, NJ, MP, UPGMA); в) указать на полученном дереве ветвь, в которую укоренено правильное дерево (если она там есть) и переукоренить дерево в неё.

  4. Дополнительное задание. Постарайтесь найти как можно больше диагностических позиций выравнивания, то есть таких, по которым можно судить о том, относится ли та или иная последовательность выравнивания к некоторому таксону. Опишите найденные диагностические позиции в отчёте на отдельной странице (со ссылкой со страницы семестра). Желательны иллюстрации в виде соответствующих фрагментов выравнивания.

  5. Дополнительное задание. Сравните результаты работы алгоритма Neighbor-joining при разных способах построения матрицы расстояний. JalView пользуется тремя "примитивными" методами (подсчёт весов сопоставлений или даже просто подсчёт процента совпадающих букв). MEGA использует более совершенный способ оценки расстояний, основанный на приниципе максимального правдоподобия. Опишите (в отчёте на отдельной странице), одинаковые ли получаются деревья, если нет, при каком методе подсчёта расстояний реконструкция получилась ближе к реальности (т.е. дереву видов).