Главная | Ссылки | Обо мне | Заметки | ||||||||||||||||||||||||||||||||||||||||||||||||||||
Реконструкция филогении по нуклеотидным последовательностям. ПаралогиЗадание 1. Построение дерева по нуклеотидным последовательностям В данном задании требовалось построить филогенетическое дерево 8 представителей протеобактерий (Таблица 1), используя нуклеотидную последовательность РНК малой субъединицы рибосомы (16S rRNA). Последовательности 16S rRNA бактерий нужных видов (штамм указан в Таблице 1) были взяты из файлов с расширением .frn в записи, принадлежащей хромосоме каждой из бактерий, на сайте NCBI. Таблица 1. Выбранные представители протеобактерий.
* - в скобках указаны исходные виды; для выполнения данного задания для отмеченных позиций были взяты другие виды того же рода Ссылка на fasta-файл с последовательностями всех требуемых 16S rRNA: 16S rRNA. Затем полученные последовательности были открыты в JalView и выровнены программой Muscle. Выравнивание в fasta-формате было импортировано в программу MEGA, где было реконструировано дерево методом Neighbor-Joining. Изображение дерева представлено на Рис. 1а (справа). Как видно из Рис. 1а, дерево, построенное по последовательностям 16S rRNA, полностью совпадает с исходным, в отличие от деревьев, построенных по последовательности белка пептидил-тРНК гидролазы. В качестве напоминания на Рис. 1b представлено одно из деревьев, построенных по последовательности белка, реконструированное методом Neighbor-Joining и укорененное в среднюю точку. Оно отличается от правильного тем, что в нем листья BURCA и NEIMA не составляют отдельную кладу. Таким образом, дерево, построенное по последовательностям РНК получилось правильным в отличие от дерева, построенного по последовательностям белка. Задание 2. Построение и анализ дерева, содержащего паралоги В данном задании было необходимо построить и проанализировать дерево гомологов белка CLPX_ECOLI из выбранных бактерий. Чтобы найти гомологов, я взяла из файлы из директории P:\y14\term4\Proteomes, содержащие полные протеомы нужных мне бактерий, скачанные из базы UniProt, и командой "cat file1 >> file2" сложила их в один файл. Затем я произвела поиск гомологов программой blastp с входной последовательностью белка CLPX_ECOLI по базе данных - файлу с нужными протеомами. Порог по E-value был взят 0.001. Использованные команды:
В выдаче (Рис. 2) всего 34 находки, из них 14 - по 2 находки, принадлежащие белку HSLU, на каждую из 7 бактерий (у бактерии NEIMA этого белка вообще нет). Остальные находки представлены в одном экземпляре для каждого белка. Для удобства в Таблице 2 перечислены мнемоники белков, встретившихся в выдаче программы blastp. Таблица 2. Мнемоники и графические выделения белков, встретившихся в выдаче blastp.
Затем последовательности были выровнены программой Muscle, по выравниванию было реконструировано дерево методом Neighbor-Joining в программе MEGA. Результат на Рис. 3. На полученном дереве указаны следующие эволюционные события:
Также на дереве указаны паралоги (красное подчеркивание) и ортологичные группы (темно-зеленые рамки).
|
© 2015 Дарья Николаева