Задание 4¶

1. Составление списка гомологичных белков, включающих паралоги: поиск в своих бактериях достоверные гомологи белка CLPX_ECOLI.¶

Из файлов, содержащихся в директории /P/y20/term4/Proteomes, были отобраны изучаемые мною бактерии. Полные протеомы этих бактерий были соединены в один файл -- базу данных, в которой я искала гомологи белка CLPX_ECOLI. Список находок из выдачи BLASTp. Сама выдача BLASTp.

Getting Started

2. Реконструкция и визуализация¶

На основе этих последовательностей реконструировано дерево найденных гомологов (MEGA, метод NJ).¶

Предварительно были выравнены все иследуемые протеомы. Результат реконструкции в Newick формате:

((((((((CLPX_MYCTU,CLPX_MYCLE),CLPX_RHOJR),CLPX_ARTS2),(CLPX_LEIXX,CLPX_CLAMS)),(RUVB_ARTS2,A0JR82_ARTS2)),((Q6ACQ0_LEXX,B0RHW4_CLAMS),(Q0S8E3_RHOJR(FTSH_MYCTU,FTSH_MYCLE)))),(CLPX_BIFLO,A0K1M3_ARTS2)), ((RUVB_BIFLO, Q8G3S2_BIFLO), (A0K236_ARTS2,(QOS6Y7_RHOJR,(Q8G671_BIFLO,Q0S8C7_RHOJR)))));

Пары ортологов¶

  • CLPX_MYCTU и CLPX_MYCLE
  • CLPX_RHOJR и CLPX_ARTS2
  • FTSH_MYCTU и FTSH_MYCLE

Пары паралогов¶

  • CLPX_MYCTU и FTSH_MYCTU
  • A0K1M3_ARTS2 и CLPX_ARTS2
  • CLPX_MYCLE и FTSH_MYCLE
Реконструированное дерево найденных гомологов (методом NJ) с окрашенными ортологичными группами¶

Getting Started

Дерево со схлопнутыми ветвями¶

Getting Started

В полученном дереве я выделила две большие группы ортологов.

  1. CLPX - АТФ-связывающие субъединицы протеазы Clp. Интересно, что в нее вошли все исследуемые организмы, кроме BIFLO. Не соответсвует дереву видов, так как из этой реконструкции получатся, что BIFLO отделился раньше, чем все остальные 6 бактерий. А на дереве видов он близок к LEIXX, CLAMS, ARTS2.
  1. FtsH - цинковые металлопротеазы. В эту группу входят только LEIXX, CLAMS,RHOJR, MYCTU, MYCLE. С деревом видов сходится. На дереве с такой функцией есть еще и ATRS2, но это другой белок, реконструирующийся далеко от нашей группы и не соотносящейся с деревом видов.

  2. Остальные белки не образуют характерных групп.