Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2017

Занятие 2. Реконструкция филогении

Отчёт по первому заданию присоединяйте к отчёту по предыдущему практикуму, он должен быть готов к 23 февраля.

Письменные отчёты по заданиям 2–6 не требуются, вы будете их "защищать" на четвёртом занятии.

Заведите в правильном месте рабочую директорию. Все файлы, относящиеся к заданию, храните там, они понадобятся вам при "защите".

 

  1. Пользуясь таксономическим сервисом NCBI: http://www.ncbi.nlm.nih.gov/taxonomy/, определите, к каким таксонам относятся отобранные вами бактерии. Какие нетривиальные ветви на дереве отобранных бактерий выделяют какие-нибудь из таксонов? (укажите в отчёте ветви и таксоны).

  2. Из списка функций белков выберите одну: по белкам соответствующего семейства вы будете реконструировать филогенетическое дерево.

Функция

Мнемоника

Фактор элонгации трансляции Ts

EFTS

Фактор высвобождения пептидной цепи 1

RF1

Рибосомный белок L1

RL1

Рибосомный белок L2

RL2

Рибосомный белок S2

RS2

Рибосомный белок S4

RS4

Пептидил-тРНК гидролаза

PTH

16S рРНК-метилтрансфераза H

RSMH

Энолаза

ENO

Бета-субъединица траскриптазы

RPOB

Триггер-фактор

TIG

АТФаза Sec-транслоконовой системы

SECA

  1. Получите из Swiss-Prot последовательности белков с данной функцией из отобранных вами бактерий и выровняйте их.

Подсказка
Первый вариант. Запустите JalView. В меню File выберите Fetch sequences. Щёлкните по "Select Database" и выберите Uniprot. Запишите через точку с запятой выражения вида xxxx_yyyyy, где xxxx – выбранная вами мнемоника функции, а yyyyy – мнемоники отобранных вами организмов. После нажатия OK должно появиться окно с последовательностями. В этом окне выберите Web Service → Alignment → любая программа (например Muscle).
Второй вариант.
1) Составьте список идентификаторов белков по схеме как выше (например, CRP_ECOLI, CRP_SALTY, CRP_SHIFL).
2) Вставьте список в форму загрузки из Uniprot и найдите белки. Дальше их можно скачать кнопкой "Download" и сохранить.
3) Построить выравнивание можно с помощью сервера Muscle или на kodomo, командой:
muscle -in <fasta file> -out <new file>

  1. Отредактируйте названия последовательностей: оставьте от названия каждого белка только мнемонику вида (так легче будет сравнивать деревья). Если действовали через JalView, предварительно сохраните выравнивание в fasta-формате.

  2. Откройте выравнивание в MEGA (методом "Analyze") и реконструируйте филогению тремя различными методами. Сохраните полученные деревья в формате Newick в файлы с такими названиями, по которым вы сможете потом понять, где какая реконструкция.
  3. К 1 марта будьте готовы: а) сообщить, какими методами реконструированы деревья и открыть любое из них в MEGA; б) указать на дереве все нетривиальные ветви; в) объяснить, отличается ли дерево по топологии и укоренению от правильного (построенного при выполнении предыдущего задания) – если да, то чем; если нет, то почему вы в этом уверены. Также будьте готовы открыть в MEGA само выравнивание и продемонстрировать реконструкцию филогении любым указанным методом (ML, ME, NJ, MP, UPGMA).

  4. Дополнительное задание. Разберитесь, как пользоваться программами fprotdist и fneighbor на kodomo. Получите дерево и сравните результаты с результатом работы алгоритма Neighbor-joining в программе MEGA. Опишите (в отчёте на отдельной странице), процедуру работы с программами и одинаковые ли получаются деревья (если нет, то попробуйте разобраться, почему). Попробуйте также получить изображения деревьев программами fdrawgram и fdrawtree, если удастся, напишите инструкцию для пользователя.