Паралоги, визуализация
Yamanaka lake, Hiroshi Yokida

Паралоги, визуализация


1. Составление списка гомологичных белков, включающих паралоги

Необходимо было найти достоверные гомологи белка CLPX_ECOLI в протеомах организмов, с которыми велась работа в 1 практикуме.

Из директории /P/y19/term4/Proteomes перенёс к себе файлы с протеомами соответствующих бактерий, командой cat AGRFC.fasta BURCA.fasta RHIME.fasta SACD2.fasta BRUSU.fasta HAEIN.fasta ROSDO.fasta SHEDO.fasta >> data.fasta записывал в конец последнего файла протеомы. Командой makeblastdb -dbtype prot -in data.fasta -out bacteria сделал из получившегося файла датабазу, по которой будет происходить поиск blastp. Командой blastp -query query.fasta -db bacteria -out out.txt -evalue 0.001 провёл поиск программой blastp гомологов по протеомам выбранных бактерий. Список находок из выдачи BLAST находится в файле out.txt.

2. Реконструкция и визуализация

В файле data.fasta находятся последовательности всех последовательностей белков из выдачи. Они были выравнены muscle с параметрами по умолчанию. Полученное выравнивание было загружено в MEGA методом Analize. Филогенетическое дерево было получено UPGMA методом, посмотреть его в Newick-формате можно здесь. Визуализация дерева осуществлялась с помощью iTOL.

Для примера ортологов/паралогов:

  • три пары паралогов (присутствуют в одном организме, разошлись после генной дупликации): Q92M98_RHIME и CLPX_RHIME, HSLU_BURCA и CLPX_BURCA, FTSH_HAEN и HSLU_HAEN;
  • три пары ортологов (разошлись в ходе видообразования): CLPX_RHIME и CLPX_AGRFC, HSLU_RHIME и HSLU_AGRFC, FTSH_HAEIN и A0A0H3GCZ6_BRUSU.

Изображение 1. Филогенетическое дерево гомологичных CLPX_ECOLI белков, ортологичные группы выделены разными цветами.

Изображение 2. Филогенетическое дерево гомологичных CLPX_ECOLI белков, ортологичные группы выделены разными цветами и схлопнуты, если в них больше 3 последовательностей. В группах ClpX и hslU присутствуют последовательности из всех рассматриваемых бактерий, филогения hslU наиболее соответствует установленной ранее филогении. В группе ftsH представлены только последовательности для Agrobacterium fabrum, Rhizobium meliloti, Brucella suis и Haemophilus influenzae.

Ссылки для себя на будущее