Составление списка гомологичных белков, включающих паралоги


Сначала я собрала в своей директории полные протеомы своих бактерий, потом сделала бласт. С помощью команд:
✔ cp /P/y20/term4/Proteomes/XXX.fasta XXX.fasta
✔ makeblastdb -in XXX.fasta -dbtype prot
✔ makeblastdb -in CLPX_ECOLI.fasta -dbtype prot
✔ blastp -query CLPX_ECOLI.fasta -db ARTS2.fasta -out ./result/ARTS2 -evalue 0.001
В конечном итоге был получен результат, который доступен для просмотра в прикрепленном файле. Результат

С помощью программы Jalview найденные последовательности были выравнены (с помощью Muscle). Далее выравнивание было импортировано в программу MEGA. В данной программе было реконструировано дерево с помощью алгоритма Neighbor joining.
Дерево в Newick-формате

На представленном выше изображении крупные группы ортологов обьеденены квадратными скобками (ClpX, RuvB, и ClpX).
Примеры паралогов: ClpX_BIFLO и RuvB_BIFLO, Q8FMG2_COREF и Q8FMH5_COREF, A0K1M3_ARTS2 и ClpX_ARTS2
Примеры ортологов: RuvB_ACIC1 и RuvB_COREF, Q6NF92_CORDI и Q8FMG2_COREF, ClpX_CLAMS и ClpX_LEIXX




Из выше представленного изображения (ортологи из выше упомянутых групп объединены в одну кладу), можно сделать вывод, что белки достаточно давно разошлись эволюционным путем, так как они хорошо разделяются на три группы на филогенетическом дереве.



Описание групп:
Ортологичная группа ClpX - АТФ-зависимая цинковая металлопротеаза. Найдена у 7 из 7 бактерий. 3 ветви совпали.
Ортологичная группа RuvB - хеликаза структуры Холидея. Найдена у 4 из 7 бактерий. 0 ветвей совпало. Несовпадние можно обьяснить тем что, филогения бактерий строилась по полному геному (скорее всего, так как у нас нет информации откуда взята эта филогения), поэтому в частном случае может наблюдаться несколько иное дерево.
Ортологичная группа FtSH - АТФ-зависимая цинковая металлопротеаза. Найдена у 7 из 7 бактерий. Все ветви совпали.