Учебный сайт Ксении Худяковой

Главная > Семестры > Семестр 4 > Практикум 4

Занятие 4. Нуклеотидные последовательности и паралоги

1. Построение дерева по нуклеотидным последовательностям

Нужно было построить дерево тех же бактерий, что и в предыдущих заданиях, но на этот раз используя последовательности 16S РНК. Последовательности были добыты с помощью базы данных Silva. Из всех найденных последовательностей выбраны по одной, которые близки к 1500 нуклеотидов, т.к. это примерная длина 16S РНК.

Файл с последовательностями.

Теперь последовательности нужно выровнять. Для этого была использована программа Aliview (скачана отсюда).

После получения выравнивания можно строить дерево. Я выбрала метод максимального правдоподобия.

Это правильное (старое) дерево:

В этом (новом) дереве правильно определена наиболее внешняя группа - клостридии. Так же правильно обособлены Bacillales и ветвь, ведущая к энтерококкам и стрептококкам. А ветвь с лактобациллами расположена неверно: она должна быть внешней для энтерококков и стрептококков, а не для всех Bacilli. Это дерево значительно ближе к правильному, чем полученное по белку шаперонину укоренением в среднюю точку:

И чем полученное по тому же белку сравнением с внешней группой:

2. Построение и анализ дерева, содержащего паралоги

Для выполнения задания нужно найти достоверных гомологов белка CLPX_BACSU для всех моих бактерий. Для этого я воспользовалась программой blastp по базе данных, собранной из протеомов моих бактерий.


Использованные команды:


makeblastdb -in proteomi.fasta -dbtype prot

blastp -query CLPX.fasta -db proteomi.fasta -evalue 0.001 -outfmt 7 -word_size 2 -out homologs_exp.txt

cat homologs_exe.txt | egrep -v '#' | awk ' {print $2}' | awk ' BEGIN {FS = "|"} {print "fasta::proteomi.fasta:" $3}' | sort -u > my_id.bs

seqret @my_id.bs

Получился файл, который теперь нужно выровнять. Для выравнивания я использовала сервер Muscle. Файл с выравниванием.

После чего было построено дерево в MEGA методом максимального правдоподобия.

На нём видны многочисленные группы попарно ортологичных белков: АТФ-связывающая субъединица АТФ-зависимой Clp протеазы. На этом поддереве видно, что раньше всех от предковой ветви отделилась Clp протеаза Lactobacillus acidophilus. Когда случилось, например, разделение общего предка клостридий на Clostridium botulinum и Clostridium tetani, этот белок так же разделился на две формы, и они стали эволюционировать порознь. Еще один пример группы попарных ортологов: АТФ-зависимая цинковая металлопротеаза FtsH. В ней видны ещё по два паралога у Clostridium botulinum и Clostridium tetani. Это - дупликация гена. Есть интересный пример паралогов настолько далеких, что между ними расположилась целая группа белков другого семейства. Это АТФ-связывающая субъединица АТФ-зависимой Clp протеазы Lactobacillus acidophilus.