Построение и анализ дерева, содержащего паралоги

Создадим файл с протеомами необходимых бактерий при помощи команды: cat /P/y17/term4/Proteomes/mnemonics.fasta >> for_blast.fasta, где mnemonics - это мнемоника необходимой бактерии. Далее при помощи программы blastp произведём поиск гомологов белка с мнемоникой CLPX_ECOLI (blastp -query CLPX_ECOLI.fasta -db for_blast.fasta -out homolog.fasta -evalue 0.001).

Список гомологичных белков доступен в файле. Скачаем белковые последовательности и выровним их при помощи muscle (muscle -in clpx_seq.fasta -out 403_align.fasta). Далее алгоритмом UPGMA построим дерево.

Рисунок 1. Филогенетическое дерево гомологичных белков CLPX_ECOLI, построенное алгоритмом UPGMA программой MEGA7. Красная и фиолетовая рамка - группы ортологов, голубая и синяя - примеры паралогов. Дупликации какого-либо гена в пределах организма не наблюдается.

© Marina Kan, 2019