Практикум №4

Паралоги, визуализация

Задание №1. Выдача blastp

                                                                      Score     E
Sequences producing significant alignments:                          (Bits)  Value

  sp|Q891J8|CLPX_CLOTE ATP-dependent Clp protease ATP-binding sub...   538    0.0   
  sp|Q2RL30|CLPX_MOOTA ATP-dependent Clp protease ATP-binding sub...   533    0.0   
  sp|P50866|CLPX_BACSU ATP-dependent Clp protease ATP-binding sub...   516    0.0   
  sp|Q8Y7K9|CLPX_LISMO ATP-dependent Clp protease ATP-binding sub...   511    1e-179
  sp|Q833M7|CLPX_ENTFA ATP-dependent Clp protease ATP-binding sub...   498    2e-174
  sp|P63791|CLPX_STRPN ATP-dependent Clp protease ATP-binding sub...   486    4e-170
  tr|Q5FKR6|Q5FKR6_LACAC ATP-dependent Clp protease ATP-binding s...   484    3e-169
  sp|P39778|CLPY_BACSU ATP-dependent protease ATPase subunit ClpY...   106    2e-25 
  sp|Q834K4|HSLU_ENTFA ATP-dependent protease ATPase subunit HslU...   103    3e-24 
  sp|Q5FKD8|HSLU_LACAC ATP-dependent protease ATPase subunit HslU...   101    1e-23 
  tr|Q2RJP5|Q2RJP5_MOOTA ATP-dependent protease ATPase subunit Hs...   100    4e-23 
  sp|Q8Y7J8|HSLU_LISMO ATP-dependent protease ATPase subunit HslU...  99.8    6e-23 
  tr|Q8Y8B1|Q8Y8B1_LISMO UVR domain-containing protein OS=Listeri...  60.5    5e-10 
  sp|O31673|CLPE_BACSU ATP-dependent Clp protease ATP-binding sub...  56.2    1e-08 
  tr|M4YZ72|M4YZ72_STREQ Negative regulator of genetic competence...  52.0    3e-07 
  tr|Q2RLR4|Q2RLR4_MOOTA AAA domain-containing protein OS=Moorell...  50.1    6e-07 
  tr|A0A0H2USJ7|A0A0H2USJ7_STRPN ATP-dependent Clp protease, ATP-...  50.4    7e-07 
  tr|Q5FHW6|Q5FHW6_LACAC UVR domain-containing protein OS=Lactoba...  48.9    2e-06 
  tr|Q2RLP6|Q2RLP6_MOOTA AAA domain-containing protein OS=Moorell...  48.5    2e-06 
  tr|M4YWY5|M4YWY5_STREQ Sigma-54 factor interaction domain-conta...  47.8    5e-06 
  tr|M4YVJ8|M4YVJ8_STREQ ATP-dependent zinc metalloprotease FtsH ...  47.8    5e-06 
  tr|Q891B9|Q891B9_CLOTE ATP-dependent zinc metalloprotease FtsH ...  47.8    5e-06 
  tr|Q899H3|Q899H3_CLOTE ATP-dependent zinc metalloprotease FtsH ...  46.6    1e-05 
  sp|O69076|FTSH_STRPN ATP-dependent zinc metalloprotease FtsH OS...  46.2    1e-05 
  tr|Q895L6|Q895L6_CLOTE AAA domain-containing protein OS=Clostri...  43.5    1e-04 
  tr|Q2RM95|Q2RM95_MOOTA ATP-dependent zinc metalloprotease FtsH ...  43.1    1e-04 
  tr|Q8YAC6|Q8YAC6_LISMO ATP-dependent zinc metalloprotease FtsH ...  43.1    2e-04 
  tr|Q898D1|Q898D1_CLOTE AAA domain-containing protein OS=Clostri...  42.7    2e-04 
  tr|Q5FMA3|Q5FMA3_LACAC ATP-dependent zinc metalloprotease FtsH ...  42.4    2e-04 
  tr|Q839B1|Q839B1_ENTFA ATP-dependent zinc metalloprotease FtsH ...  41.6    4e-04 
  sp|P37476|FTSH_BACSU ATP-dependent zinc metalloprotease FtsH OS...  40.8    6e-04 
  tr|Q2RJJ8|Q2RJJ8_MOOTA AAA domain-containing protein OS=Moorell...  40.4    9e-04 

Задание №2. Реконструкция и визуализация

Реконструкция проводилась в программе MEGA-X методом Neighbor-Joining. Предварительно в MEGA-X было выполнено выравнивание последовательностей (алгоритм Muscle)

В результате было получено дерево в Newick-формате: nj_pr4.nwk

Гомологичные белки называются ортологами, если они из разных организмов и разделение их общего предка произошло в результате видообразования

Гомологичные белки из одного организма называются паралогами

Паралоги Ортологи
FTSH BACSU и CLPE BACSU CLPX BACSU и CLPX LISMO
Q2RJJ8 MOOTA и CLPX MOOTA HSLU ENTFA и HSLU LACAC
HSLU ENTFA и Q839B1 ENTFA CLPX ENTFA и CLPX STRPN

Были выделены ортологичные группы

Orthologs tree

Затем ортологичные группы были "схлопнуты" и надписаны

Orthologs tree

Group 1: CLPX - BACSU, LISMO, MOOTA, CLOTE, ENTFA, STRPN; Q5FKR6 - LACAC

Group 2: HSLU - ENTFA, LACAC, LISMO; CLPY - BACSU; Q2RJP5 - MOOTA

Group 3: Different rthologs - STREQ, STRPN, LISMO, BACSU, LACAC

Group 4: Different orthologs - ENTFA, LACAC, STREQ, STRPN

Результаты

Построенная филогения белков в целом соответсвует филогенетическому дереву бактерий из 1 практикума

CLPX - АТФ-связывающие субъединицы ClpX протеазы Clp, один из белков из TrEMBL. Для группы 1 филогения белков частично соответствует исхоному дереву бактерий (различие в CLPX ENTFA и CLPX STRPN)

HSLU — АТФазные субъединицы протеаз. Филогения белков 2 группы соответствует исхоному дереву бактерий

Филогения белков 3 группы также похожа на исходное дерево бактерий

FTSH — цинковая металлопротеаза. Филогения белков 4 группы соответствует исхоному дереву бактерий

Вернуться на главную страницу