Задание №1: Составление списка гомологичных белков, включающих паралоги
Для нахождения белков, гомологичных
CLPX_ECOLI (АТФ-связывающая субъединица ClpX протеазы Clp Escherichia coli) среди последовательностей протеомов бактерий, выбранных в первом задании, использованы следующие команды:
makeblastdb -dbtype prot -in proteomes.fasta
blastp -query P0A6H1.fasta -evalue 0.001 -outfmt 7 -db proteomes.fasta 1>> proteins.txt
Найдено 28 гомологов.
Таблица 1. Найденные гомологи белка CLPX_ECOLI
| Мнемоника | Белок |
|---|---|
| RUVB_BIFLO | Holliday junction branch migration complex subunit RuvB |
| RUVB_ARTS2 | Holliday junction ATP-dependent DNA helicase RuvB |
| A0K236_ARTS2 | AAA ATPase, central domain protein |
| A0LW31_ACIC1 | AAA ATPase, central domain protein |
| FTSH_ACIC1 | ATP-dependent zinc metalloprotease FtsH |
| Q6NF92_CORDI | Cell division protein |
| FTSH_RUBXD | ATP-dependent zinc metalloprotease FtsH |
| A0LRB8_ACIC1 | ATP-dependent zinc metalloprotease FtsH |
| Q47KU4_THEFY | Peptidase M41, FtsH precursor |
| Q8G3S2_BIFLO | ATP-dependent zinc metallopeptidase involved in cell division |
| A0JR82_ARTS2 | ATP-dependent zinc metalloprotease FtsH |
| Q6ACQ0_LEIXX | Cell division protein |
| B0RHW4_CLAMS | cell division protein ftsH homolog [Clavibacter michiganensis subsp. sepedonicus] |
| Q6NGK1_CORDI | Hypothetical protein |
| Q47MZ2_THEFY | ATPase precursor |
| A0K1M3_ARTS2 | ATPase AAA-2 domain protein |
| Q1AY82_RUBXD | ATPase AAA-2 |
| Q1AU05_RUBXD | ATPase AAA-2 |
| Q8G871_BIFLO | Protease |
| Q6NFB1_CORDI | ATP-dependent Clp protease ATP-binding subunit |
| CLPX_BIFLO | ATP-dependent Clp protease ATP-binding subunit ClpX |
| Q1AVT0_RUBXD | ATP-dependent Clp protease ATP-binding subunit ClpX |
| CLPX_CORDI | ATP-dependent Clp protease ATP-binding subunit ClpX |
| CLPX_LEIXX | TP-dependent Clp protease ATP-binding subunit ClpX |
| CLPX_CLAMS | ATP-dependent Clp protease ATP-binding subunit ClpX |
| CLPX_ARTS2 | ATP-dependent Clp protease ATP-binding subunit ClpX |
| CLPX_ACIC1 | ATP-dependent Clp protease ATP-binding subunit ClpX |
| Q47MU4_THEFY | ATPase regulatory subunit |
Задание №2: Реконструкция и визуализация
Для построения деревьев была использована программа NGPhylogeny.fr: MAFFT → FastME
Параметры:
Gamma distributed rates across sites - No
Starting tree - BIONJ
No refinement
Number of bootstrap replicates - 100
Скобочная формула.
Рис. 1 Филогенетическое дерево бактерий.
Рис. 2 Филогенетическое дерево гомологов белка CLPX_ECOLI. Ортологические и паралогические группы отмечены разными цветами,
числами показаны bootstrap-поддержки соответствующих ветвей.
Рис. 3 Филогенетическое дерево гомологов белка CLPX_ECOLI. Ортологические группы "схлопнуты".
Дерево переукренено в среднюю точку.
Пары ортологов: CLPX_LEIXX и CLPX_CLAMS, RUVB_BIFLO и RUVB_ARTS2, A0LRB8_ACIC1 и Q47KU4_THEFY.
Пары паралогов: A0LRB8_ACIC1 и FTSH_ACIC1, Q1AY82_RUBXD и Q1AU05_RUBXD, A0JR82_ARTS2 и A0K236_ARTS2.
На основе описания белгов можно выделить две ортологические группы: ATP-dependent Clp protease ATP-binding subunit ClpX и ATP-dependent zinc metalloprotease FtsH .
Также можно сравнить ортологические группы с эталонным деревом (Рис. 1).
Начала рассмотрим группу ATP-dependent Clp protease ATP-binding subunit ClpX. Можно заметить, что в группу попали белки из всех восьми бактерий, но реконструированная филогения неполностью совпадает с эталонной, но при этом часть нетривиальных ветвей правильные.
Теперь рассмотрим группу ATP-dependent zinc metalloprotease FtsH . В нее попали все белки из восьми бактерий, а также реконструированная филогения полностью совпадает с эталонной.