Реконструкция филогении по нуклеотидным последовательностям. Паралоги
Заданиe 1. Построение дерева по нуклеотидным последовательностям 16s рРНК
С сайта базы 16S рРНК были взяты кодирующие нуклеотидные последовательности для заданных бактерий (см. практикум 1). Выровняли последовательности с помощью алгоритма Muscle. Затем по выравниванию построили дерево методом Neighbor-Joining. Оно показано на рисунке 1. Дерево отличается от правильного (рис.2). Бактерии GEOKA и LACAC поменялись местами. Ветвь LISMO изменила свое положение в дереве. Построение дерева по 16S рРНК оказалось менее точным, чем по белку.
Заданиe 2. Дерево, содержащее паралоги и ортологи
В протеомах тех же бактерий нашли гомологи белка субъединицы Clp протеазы бактерии Bacillus subtilis. Чтобы найти гомологов в заданных организмах, использовались файлы, содержащие скачанные из Uniprot полные протеомы бактерий, перечисленных в таблице предыдущего практикума. Был проведен поиск программой blastp гомологов (с порогом на E-value 0,001) по протеомах отобранных бактерий. Геномы нужных бактерий были слиты в один файл all1.fasta, была создана база типа prot и проведен blast:
makeblastdb -in all1.fasta -dbtype prot -out all.fasta blastp -query CLPX_BACSU.fasta -db all.fasta -evalue 0.001 -outfmt 7 -word_size 3 -out homologus
BLAST нашел 25 последовательностей. Через сайт Uniprot получили fasta-файл с этими белками, выровняли их через Muscle. Выравнивание
Дерево, сделанное по алгоритму Neighbor-Joining, показано на рисунке 3.
На полученном дереве найдены примеры ортологов (разделение путей эволюции белков в результате видообразования) и парологов (дупликация гена с последующей эволюцией). Ортологи показаны на рисунках 4 и 5, паралоги -- 6 и 7.