Личный сайт
Просвирова Кирилла

Занятие 4

Построение дерева по нуклеотидным последовательностям 16S РНК

Fasta-файл последовательностей составлялся при помощи сайта 16S RRNA database . Выравнивание произведено с помощью алгоритма mafft со стандартными параметрами. Дерево построено программой MEGA с использованием алгоритма Maximum Likelihood. Дерево идентично правильному из первого практикума. Выравнивание может быть получено по ссылке : выравнивание .

Рис. 1. Дерево.

Построение и анализ дерева, содержащего паралоги

Чтобы найти гомологов в заданных организмах, воспользуйтесь файлами, лежащими в директории P:\y13\term4\Proteomes (они содержат скачанные из Uniprot полные протеомы бактерий, перечисленных в таблице первого практикума). Необходимо провести поиск программой blastp гомологов (с разумным порогом на E-value, скажем, 0,001) по протеомам отобранных вами бактерий. Геномы нужных бактерий были слиты в один файл - total.fasta, была создана база типа prot и проведен бласт:
blastp -query P50866.fasta -db total.fasta -evalue 0.001 -outfmt 7 -word_size 3 -out homologs_exp.txt
cat homologs.txt | egrep -v '#' | awk ' {print $2}' | awk ' BEGIN {FS = "|"} {print "fasta::total.fasta:" $3}' > my_id.bs
seqret @my_id.bs

Выравнивание может быть получено по ссылке : выравнивание .Дерево построено программой MEGA с использованием алгоритма Maximum Likelihood.

Рис. 2. Дерево.

Рис. 3. Ортологи.

Рис. 4. Ортологи. Разделение путей эволюции белков в результате видообразования

Рис. 5. Паралоги. HSLU_STAA1/1-467 A7X1N1 и CLPX_STAA1/1-420 A7X396.

Просвиров Кирилл. Дата последнего изменения: 4 октября 2014.