С помощью SRS найдите в БД UniProt аминокислотные последовательности, нужные
для заданной Вам выборки. .
Поиск ведите по названию таксона и идентификатору семейства из БД Pfam.
Профильтруйте результат поиска так, как это указано в задании.
Аминокислотные последовательности сохраните в формате FASTA2Seq. (файл
seq.txt)
Сохраните результаты поиска в виде текстовых таблиц (опция UniprotView).
Cоздайте текстовой файл с перечнем организмов выборки (taxon_names.txt). Для
этого импортируйте текстовые таблицы в Excel (разделитель - знак табуляции)
и скопируйте столбец с названиями организмов в текстовой файл.
Советы.
Сохраните выборку последовательностей в формате FASTA в одном файле.Постройте
множественное выравнивание последовательностей Вашей выборки с помощью любой
программы, создающей выходной файл в формате Clustal (emma, ClustalX, muscle....)
Реконструируйте филогенетическое дерево по алгоритму ближайших соседей (Neighbour-Joining)
с помощью программы eneighbor.
Для получения приемлемого изображения и редактирования дерева используте программу GeneMaster (GMaster.exe на диске С:/).
Требования к изображению дерева.
Совет. Не экспериментируйте с программой, не сохранив предыдущую удачную версию дерева (tree.gdt) в своей рабочей директории!!
На странице веб-сайта NCBI описан наиболее популярный вариант таксономии
живых организмов, Выберите в левом меню пункт "Taxonomy common
tree". Задайте Ваш список (файл taxon_names.txt) с помощью кнопок
<Browse> и <Add from file>. На экране должно появиться таксономическое
дерево.
Его можно сохранить или в текстовом формате (save as text tree) или
в виде скобочной структуры формата phylip (save as phylip tree, не
всегда получается) .
*Скобочную структуру можно с помощью GeneMaster превратить в красивое изображение дерева. Для этого нужно немного подредактировать текст скобочной структуры, соединить названия рода и вида в одно слово с помощью "_" и убрать лишние символы одиночных кавычек. При импорте файла используйте опцию <Show Bootstrap>
Ваша задача - найти на дереве и описать в отчете не менее 3 пар наиболее
вероятных ортологов и не менее 3-х пар наиболее вероятных паралогов.
В отчете приведите обоснование своего выбора.
Выделите на дереве каждую группу ортологов своим цветом.