Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2018

Практикум 2. Реконструкция филогении

Отчёт по первому заданию присоединяйте к отчёту по предыдущему практикуму, он должен быть готов к 21 февраля.

Письменные отчёты по заданиям 2–6 не требуются, вы будете их "защищать" на коллоквиуме в конце блока.

Заведите в правильном месте рабочую директорию. Все файлы, относящиеся к заданию, храните там, они понадобятся вам при "защите".

 

  1. Пользуясь таксономическим сервисом NCBI: https://www.ncbi.nlm.nih.gov/taxonomy/, определите, к каким таксонам относятся отобранные вами бактерии. Какие нетривиальные ветви на дереве отобранных бактерий выделяют какие-нибудь из таксонов? (укажите в отчёте ветви и таксоны).

  2. Из списка функций белков выберите одну: по белкам соответствующего семейства вы будете реконструировать филогенетическое дерево.

Функция

Мнемоника

Фактор элонгации трансляции Ts

EFTS

Фактор высвобождения пептидной цепи 1

RF1

Рибосомный белок L1

RL1

Рибосомный белок L2

RL2

Рибосомный белок S2

RS2

Рибосомный белок S3

RS3

Рибосомный белок S4

RS4

Пептидил-тРНК гидролаза

PTH

16S рРНК-метилтрансфераза H

RSMH

Энолаза

ENO

Бета-субъединица траскриптазы

RPOB

Триггер-фактор

TIG

  1. Получите из Swiss-Prot последовательности белков с данной функцией из отобранных вами бактерий и выровняйте их.

Подсказка
Первый вариант. Запустите JalView. В меню File выберите Fetch sequences. Щёлкните по "Select Database" и выберите Uniprot. Запишите через точку с запятой идентификаторы белков — выражения вида xxxx_yyyyy, где xxxx – выбранная вами мнемоника функции, а yyyyy – мнемоники отобранных вами организмов. После нажатия OK должно появиться окно с последовательностями. В этом окне выберите Web Service → Alignment → любая программа (например Muscle).
Второй вариант.
1) Составьте список идентификаторов белков по схеме как выше (например, PTH_BACAN, PTH_BACSU, PTH_CLOBA и т.д.).
2) Вставьте список в форму загрузки из Uniprot и найдите белки. Дальше их можно скачать кнопкой "Download" и сохранить.
3) Построить выравнивание можно с помощью сервера Muscle или на kodomo, командой:
muscle -in <fasta file> -out <new fasta file>
Третий вариант.
Создайте текстовый файл (назовите его, например, proteins.list) из строчек вида:

sw:pth_bacan
sw:pth_bacsu
...

(то есть идентификаторы белков, перед которыми стоит "sw:"). Теперь получите последовательности этих белков командой seqret на kodomo:

seqret @proteins.list proteins.fasta

затем выровняйте программой muscle.

  1. Отредактируйте названия последовательностей: оставьте от названия каждого белка только мнемонику вида (так легче будет сравнивать деревья). Если действовали через JalView, предварительно сохраните выравнивание в fasta-формате.

  2. Откройте выравнивание в MEGA (методом "Analyze") и реконструируйте филогению тремя различными методами. Сохраните полученные деревья в формате Newick в файлы с такими названиями, по которым вы сможете потом понять, где какая реконструкция. (Замечание: чтобы MEGA открыла файл как выравнивание, он должен иметь расширение fasta или fa).
  3. К коллоквиуму будьте готовы: а) сообщить, какими методами реконструированы деревья и открыть любое из них в MEGA; б) указать на дереве все нетривиальные ветви; в) объяснить, отличается ли дерево по топологии и укоренению от правильного (построенного при выполнении предыдущего задания) – если да, то чем; если нет, то почему вы в этом уверены. Также будьте готовы открыть в MEGA само выравнивание и продемонстрировать реконструкцию филогении любым указанным методом (ML, ME, NJ, MP, UPGMA). (Вероятная дата коллоквиума: 6 марта).

  4. Дополнительное задание. Разберитесь, как пользоваться программой fastme на kodomo. Получите дерево и сравните результаты с результатом работы алгоритма Minimum evolution в программе MEGA. Опишите (в отчёте на отдельной странице), процедуру работы с программой и одинаковые ли получаются деревья (если нет, то попробуйте разобраться, почему).

  5. Дополнительное задание. Получите изображения деревьев в разных видах программой FigTree (установлена в компьютерном классе). Напишите, чем, по вашему мнению, FigTree лучше, чем MEGA, и чем хуже. Можно вместо FigTree протестировать онлайн-сервис iTOL.