Занятие 4
Построение дерева по нуклеотидным последовательностям 16S РНК
Fasta-файл последовательностей составлялся при помощи сайта
16S RRNA database .
Выравнивание произведено с помощью алгоритма mafft со стандартными параметрами. Дерево построено программой MEGA с использованием алгоритма Maximum Likelihood. Дерево идентично правильному из первого практикума.
Выравнивание может быть получено по ссылке :
выравнивание .
Рис. 1. Дерево.
Построение и анализ дерева, содержащего паралоги
Чтобы найти гомологов в заданных организмах, воспользуйтесь файлами, лежащими в директории P:\y13\term4\Proteomes (они содержат скачанные из Uniprot полные протеомы бактерий, перечисленных в таблице первого практикума). Необходимо провести поиск программой blastp гомологов (с разумным порогом на E-value, скажем, 0,001) по протеомам отобранных вами бактерий.
Геномы нужных бактерий были слиты в один файл - total.fasta, была создана база типа prot и проведен бласт:
blastp -query P50866.fasta -db total.fasta -evalue 0.001 -outfmt 7 -word_size 3 -out homologs_exp.txt
cat homologs.txt | egrep -v '#' | awk ' {print $2}' | awk ' BEGIN {FS = "|"} {print "fasta::total.fasta:" $3}' > my_id.bs
seqret @my_id.bs
Выравнивание может быть получено по ссылке :
выравнивание .Дерево построено программой MEGA с использованием алгоритма Maximum Likelihood.
Рис. 2. Дерево.
Рис. 3. Ортологи.
Рис. 4. Ортологи. Разделение путей эволюции белков в результате видообразования
Рис. 5. Паралоги. HSLU_STAA1/1-467 A7X1N1 и CLPX_STAA1/1-420 A7X396.
Просвиров Кирилл. Дата последнего изменения: 4 октября 2014.