Учебная страница курса биоинформатики,
год поступления 2013

Занятие 2. Реконструкция филогении

Отчёт по первому заданию присоединяйте к отчёту по предыдущему практикуму.

Письменные отчёты по заданиям 2–6 не требуются, вы будете их "защищать" на четвёртом занятии.

Заведите в правильном месте рабочую директорию. Все файлы, относящиеся к заданию, храните там.

Пользуясь таксономическим сервисом NCBI: http://www.ncbi.nlm.nih.gov/taxonomy/, определите, к каким таксонам относятся отобранные вами бактерии. Какие нетривиальные ветви на дереве отобранных бактерий выделяют какие-нибудь из таксонов (укажите в отчёте ветви и таксоны).
Из списка функций белков выберите одну: по белкам соответствующего семейства вы будете реконструировать филогенетическое дерево.

Функция	Мнемоника
Фактор инициации трансляции 2	IF2
Фактор элонгации трансляции G	EFG
Фактор элонгации трансляции Ts	EFTS
Фактор высвобождения пептидной цепи 1	RF1
Рибосомный белок S2	RS2
Рибосомный белок L3	RL3
Пептидил-тРНК гидролаза	PTH
Шаперонин	HSLO

Получите из Swiss-Prot последовательности белков с данной функцией из отобранных вами бактерий и выровняйте их.

Подсказка: запустите JalView. В меню File выберите Fetch sequences. Щёлкните по "Select Database" и выберите Uniprot. Запишите через точку с запятой выражения вида xxxx_yyyyy, где xxxx – выбранная вами мнемоника функции, а yyyyy – мнемоники отобранных вами организмов. После нажатия OK должно появиться окно с последовательностями. В этом окне выберите Web Service → Alignment → любая программа (например Muscle).

Альтернативный вариант [ДД]: Для любителей дискретных шагов (вроде меня). 1) Составьте список идентификаторов белков по схеме как выше (например, CRP_ECOLI, CRP_SALTY, CRP_SHIFL). 2) Вставьте список в форму загрузки из Uniprot и найдите белки. Дальше их можно скачать кнопкой "Download" и сохранить. 3) Построить выравнивание можно с помощью сервера Muscle, подав ему файл с последовательностями и скачав результат. Действуя так, легче выполнить и следующий пункт, поскольку отредактировать имена последовательностей можно прямо в текстовом формате (до или после построения выравнивания).

В окне с выравниванием оставьте от названия каждого белка только мнемонику вида (так легче будет сравнивать деревья: правой кнопкой мыши по имени, выбираем верхний пункт меню, затем "Edit..."). Реконструируйте дерево методом "Neighbor Joining Using % Identity".
Сохраните: а) проект JalView (jar-файл); б) выравнивание в fasta-формате (с расширением "fasta"); в) дерево в Newick-формате. К 6 марта будьте готовы: а) открыть проект в JalView; б) открыть дерево в MEGA; в) указать на дереве все нетривиальные ветви; г) объяснить, отличается ли дерево по топологии от правильного (построенного при выполнении предыдущего задания) – если да, то чем; если нет, то почему вы в этом уверены.
Также будьте готовы (для этого нужно эти действия хотя бы раз проделать): а) открыть выравнивание в MEGA (методом "Analyze"); б) реконструировать дерево в MEGA указанным методом (ML, NE, NJ, MP, UPGMA); в) указать на полученном дереве ветвь, в которую укоренено правильное дерево (если она там есть) и переукоренить дерево в неё.

Подсказка [ДД]: чтобы MEGA "съела" ваше выравнивание, его можно либо напрямую открыть через File -> Open A File/Session и потом, когда предложат выбор, выбрать 'Analyze', а можно (если например вы собираетесь открывать его несколько раз) преобразовать в удобный для нее формат с помощью команды File -> Convert File Format to MEGA.

Дополнительное задание. Постарайтесь найти как можно больше диагностических позиций выравнивания, то есть таких, по которым можно судить о том, относится ли та или иная последовательность выравнивания к некоторому таксону. Опишите найденные диагностические позиции в отчёте на отдельной странице (со ссылкой со страницы семестра). Желательны иллюстрации в виде соответствующих фрагментов выравнивания.
Дополнительное задание. Сравните результаты работы алгоритма Neighbor-joining при разных способах построения матрицы расстояний. JalView пользуется тремя "примитивными" методами (подсчёт весов сопоставлений или даже просто подсчёт процента совпадающих букв). MEGA использует более совершенный способ оценки расстояний, основанный на приниципе максимального правдоподобия. Опишите (в отчёте на отдельной странице), одинаковые ли получаются деревья, если нет, при каком методе подсчёта расстояний реконструкция получилась ближе к реальности (т.е. дереву видов).

Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2013

Занятие 2. Реконструкция филогении

Kodomo

Пользователь

Учебная страница курса биоинформатики, год поступления 2013

Занятие 2. Реконструкция филогении

Учебная страница курса биоинформатики,
год поступления 2013