Учебная страница курса биоинформатики,
год поступления 2018
Практикум 2. Реконструкция филогении
Отчёт по первому заданию присоединяйте к отчёту по предыдущему практикуму, он должен быть готов к 21 февраля.
Письменные отчёты по заданиям 26 не требуются, вы будете их "защищать" на коллоквиуме в конце блока.
Заведите в правильном месте рабочую директорию. Все файлы, относящиеся к заданию, храните там, они понадобятся вам при "защите".
Пользуясь таксономическим сервисом NCBI: https://www.ncbi.nlm.nih.gov/taxonomy/, определите, к каким таксонам относятся отобранные вами бактерии. Какие нетривиальные ветви на дереве отобранных бактерий выделяют какие-нибудь из таксонов? (укажите в отчёте ветви и таксоны).
- Из списка функций белков выберите одну: по белкам соответствующего семейства вы будете реконструировать филогенетическое дерево.
Функция |
Мнемоника |
Фактор элонгации трансляции Ts |
EFTS |
Фактор высвобождения пептидной цепи 1 |
RF1 |
Рибосомный белок L1 |
RL1 |
Рибосомный белок L2 |
RL2 |
Рибосомный белок S2 |
RS2 |
Рибосомный белок S3 |
RS3 |
Рибосомный белок S4 |
RS4 |
Пептидил-тРНК гидролаза |
PTH |
16S рРНК-метилтрансфераза H |
RSMH |
Энолаза |
ENO |
Бета-субъединица траскриптазы |
RPOB |
Триггер-фактор |
TIG |
- Получите из Swiss-Prot последовательности белков с данной функцией из отобранных вами бактерий и выровняйте их.
Подсказка
Первый вариант. Запустите JalView. В меню File выберите Fetch sequences. Щёлкните по "Select Database" и выберите Uniprot. Запишите через точку с запятой идентификаторы белков — выражения вида xxxx_yyyyy, где xxxx – выбранная вами мнемоника функции, а yyyyy – мнемоники отобранных вами организмов. После нажатия OK должно появиться окно с последовательностями. В этом окне выберите Web Service → Alignment → любая программа (например Muscle).
Второй вариант.
1) Составьте список идентификаторов белков по схеме как выше (например, PTH_BACAN, PTH_BACSU, PTH_CLOBA и т.д.).
2) Вставьте список в форму загрузки из Uniprot и найдите белки. Дальше их можно скачать кнопкой "Download" и сохранить.
3) Построить выравнивание можно с помощью сервера Muscle или на kodomo, командой:
muscle -in <fasta file> -out <new fasta file>
Третий вариант.
Создайте текстовый файл (назовите его, например, proteins.list) из строчек вида:
sw:pth_bacan sw:pth_bacsu ...
(то есть идентификаторы белков, перед которыми стоит "sw:"). Теперь получите последовательности этих белков командой seqret на kodomo:
seqret @proteins.list proteins.fasta
затем выровняйте программой muscle.
Отредактируйте названия последовательностей: оставьте от названия каждого белка только мнемонику вида (так легче будет сравнивать деревья). Если действовали через JalView, предварительно сохраните выравнивание в fasta-формате.
- Откройте выравнивание в MEGA (методом "Analyze") и реконструируйте филогению тремя различными методами. Сохраните полученные деревья в формате Newick в файлы с такими названиями, по которым вы сможете потом понять, где какая реконструкция. (Замечание: чтобы MEGA открыла файл как выравнивание, он должен иметь расширение fasta или fa).
К коллоквиуму будьте готовы: а) сообщить, какими методами реконструированы деревья и открыть любое из них в MEGA; б) указать на дереве все нетривиальные ветви; в) объяснить, отличается ли дерево по топологии и укоренению от правильного (построенного при выполнении предыдущего задания) – если да, то чем; если нет, то почему вы в этом уверены. Также будьте готовы открыть в MEGA само выравнивание и продемонстрировать реконструкцию филогении любым указанным методом (ML, ME, NJ, MP, UPGMA). (Вероятная дата коллоквиума: 6 марта).
Дополнительное задание. Разберитесь, как пользоваться программой fastme на kodomo. Получите дерево и сравните результаты с результатом работы алгоритма Minimum evolution в программе MEGA. Опишите (в отчёте на отдельной странице), процедуру работы с программой и одинаковые ли получаются деревья (если нет, то попробуйте разобраться, почему).
Дополнительное задание. Получите изображения деревьев в разных видах программой FigTree (установлена в компьютерном классе). Напишите, чем, по вашему мнению, FigTree лучше, чем MEGA, и чем хуже. Можно вместо FigTree протестировать онлайн-сервис iTOL.