Учебный сайт Ксении Худяковой |
|||||
Главная | О себе | Семестры | Ссылки | ||
Занятие 4. Нуклеотидные последовательности и паралоги 1. Построение дерева по нуклеотидным последовательностям Нужно было построить дерево тех же бактерий, что и в предыдущих заданиях, но на этот раз используя последовательности 16S РНК. Последовательности были добыты с помощью базы данных Silva. Из всех найденных последовательностей выбраны по одной, которые близки к 1500 нуклеотидов, т.к. это примерная длина 16S РНК. Файл с последовательностями. Теперь последовательности нужно выровнять. Для этого была использована программа Aliview (скачана отсюда). После получения выравнивания можно строить дерево. Я выбрала метод максимального правдоподобия. Это правильное (старое) дерево: В этом (новом) дереве правильно определена наиболее внешняя группа - клостридии. Так же правильно обособлены Bacillales и ветвь, ведущая к энтерококкам и стрептококкам.
А ветвь с лактобациллами расположена неверно: она должна быть внешней для энтерококков и стрептококков, а не для всех Bacilli.
Это дерево значительно ближе к правильному, чем полученное по белку шаперонину укоренением в среднюю точку: И чем полученное по тому же белку сравнением с внешней группой: 2. Построение и анализ дерева, содержащего паралоги Для выполнения задания нужно найти достоверных гомологов белка CLPX_BACSU для всех моих бактерий. Для этого я воспользовалась программой blastp по базе данных, собранной из протеомов моих бактерий. Использованные команды: makeblastdb -in proteomi.fasta -dbtype prot blastp -query CLPX.fasta -db proteomi.fasta -evalue 0.001 -outfmt 7 -word_size 2 -out homologs_exp.txt cat homologs_exe.txt | egrep -v '#' | awk ' {print $2}' | awk ' BEGIN {FS = "|"} {print "fasta::proteomi.fasta:" $3}' | sort -u > my_id.bs seqret @my_id.bs Получился файл, который теперь нужно выровнять. Для выравнивания я использовала сервер Muscle. Файл с выравниванием. После чего было построено дерево в MEGA методом максимального правдоподобия. На нём видны многочисленные группы попарно ортологичных белков: АТФ-связывающая субъединица АТФ-зависимой Clp протеазы. На этом поддереве видно, что раньше всех от предковой ветви отделилась Clp протеаза Lactobacillus acidophilus. Когда случилось, например, разделение общего предка клостридий на Clostridium botulinum и Clostridium tetani, этот белок так же разделился на две формы, и они стали эволюционировать порознь. Еще один пример группы попарных ортологов: АТФ-зависимая цинковая металлопротеаза FtsH. В ней видны ещё по два паралога у Clostridium botulinum и Clostridium tetani. Это - дупликация гена. Есть интересный пример паралогов настолько далеких, что между ними расположилась целая группа белков другого семейства. Это АТФ-связывающая субъединица АТФ-зависимой Clp протеазы Lactobacillus acidophilus. |
|||||