Поиск сигналов

Главная страница
Для работы я выбрала домен цитохрома C (PF00034).
Цитохромы C – переносчики электронов, белки этого семейства участвуют в большом количестве окислительно-восстановительных реакций, например, в дыхательной цепи в митохондриях.

На выравнивание для этого семейства доменов из базы данных Pfam, видны консервативные колонки (есть три абсолютно консервативные колонки, расположенные рядом: C**CH – место присоединения гема) (Рис.1).


Рис.1 Выравнивание с раскраской ClustalX, порог консервативности 15%.

Проект Jalwiew с выравниванием всех последовательностей с данным доменом.
Файл в формате fasta.

Этот домен входит в 125 архитектур.

Я выбрала две доменные архитектуры.

Первая: цитохром С(PF00034) + цитохром С оксидаза CBB3-типа (PF13442)

Вторая: трансмембранный домен цитохром С оксидазы второго типа (PF02790) + переплазматический домен цитохром С оксидазы второго типа (PF00116) + цитохром С (PF00034)

Цитохром с-оксидазы— терминальные оксидазы дыхательной цепи, катализируют перенос электронов с цитохрома с на кислород.
Благодаря высокому сродству к кислороду, оксидазе cbb3-типа приписывают основную роль в процессе дыхания в условиях с пониженной концентрацией кислорода.

В качестве таксона я взяла бактерий, а в качестве подтаксонов Acidobacteria (A) и Proteobacteria (P).

Проект Jalwiew с выравниванием последовательностей с этими архитектурами.
Порог консервативности раскраски 15% в обеих группах.

На основе выравнивания было построено дерево с помощью Neighbour Joining Using % Identity из Jalview (Рис. 2).

Его скобочная формула:
((2_P_M4V651_9DELT,(1_P_Q3J1P5_RHOS4,(1_P_B2JCS5_BURP8,(1_A_Q1IPC7_KORVE,(1_P_A0A077DCT3_9BURK,((1_A_D3F343_CONWI,(1_P_Q63JI7_BURPS,(2_A_M4ZW08_9ACTN,(((2_P_A5GCS3_GEOUR,((((2_P_Q3A1J0_PELCD,(2_P_Q74GM4_GEOSL,2_P_Q39Z27_GEOMG),2_P_B5EJ51_GEOBB),(((2_P_Q72B26_DESVH,2_P_B8DKR1_DESVM),2_P_Q310M3_DESAG),2_P_C7LU08_DESBD)),(2_P_A9F508_SORC5,(2_P_A0A0D5LU24_9RHIZ,(2_A_Q1IMA3_KORVE,2_A_Q02BQ9_SOLUE)))),(((1_P_A0A090AMH1_9GAMM,1_P_Q609P7_METCA),(1_A_G8NPV4_GRAMM,2_A_M5A617_9ACTN)),((1_P_A0A060B605_9GAMM,(1_P_M5DMH6_9GAMM,1_P_K0C3J5_CYCSP)),((((1_P_A0A068SSV5_RHIGA,1_P_B2IDZ4_BEII9),((1_P_A8GE96_SERP5,1_P_M4NCV3_9GAMM),((1_P_K0I2N0_9BURK,1_P_A8I8Y4_AZOC5,1_P_K0CAI4_ALCDB)),(1_P_A0A024H9U6_PSEKB,1_P_K0WVA0_PSEFL)),((2_P_B6JIX6_OLICO,1_P_A0A085BZ61_9RHOB),(1_A_H6RNK0_BLASD,(((2_A_E8X2I4_GRATM,2_A_E8V450_TERSS),(2_A_Q01PD2_SOLUE,1_P_G8NPV0_GRAMM)),1_A_H6RNJ6_BLASD)),((((1_A_L0IXW8_MYCSM,((1_A_M1NZJ0_9CORY,1_A_A0A097IH87_9CORY,1_A_A0A075TW44_9CORY)),1_A_G0G3G1_AMYMS),((1_A_E2SAM9_9ACTN,((2_A_C7R4P0_JONDD,1_A_B2GHS5_KOCRD),1_A_F6FWJ6_ISOV2)),(1_A_K7SIE6_PROA4,((1_A_A0A0A1DTB6_NOCSI,1_A_E4N9X7_KITSK),(1_A_C7QBM2_CATAD,(2_A_A6WD26_KINRD,1_A_A8LFE5_FRASN)))))),1_A_C7M193_ACIFD))))),2_A_A5WG96_PSYWF)))))),2_P_Q2IK63_ANADE);


Рис. 2. Филогенетическое дерево для доменных архетиктур

На дереве заметно отделяются А_1, 2_P и 1_Р. Представители 2_A разбросаны по всему дереву, однако наибольшая их концентрация наблюдается внутри группы с 1_Р. Я думаю, что появление цитохром С оксидазы 2 типа и цитохром С оксидазы CBB3-типа произошло эволюционно раньше, чем разделение бактерий на типы.
И среди Acidobacteria и среди Proteobacteria встречаются бактерии, живущие в условиях недостатка кислорода, которым может понадобиться оксидаза cbb3 типа. Протеобактерии – вообще очень большая и неоднородная группа.
Кроме того, стоит отметить, что оксидазы сходны по строению, чем может объяснятся значительное перемешивание представителей на дереве.

Для построения профиля я взяла кладу с А_1.

Профиль, построенный с помощью программы hmm2build и откалиброванный hmm2calibrate.

С помощью программы hmm2search по полученному профилю был проведен поиск в базе UniProt. На основании данных об E-value находок была построена ROC-кривая (Рис. 3). Чувствительность - доля предсказанных белков, содержащих домен. Специфичность - доля предсказанных белков, не содержащих домен.


Рис. 3 ROC-кривая

По ROC-кривой я выбрала порог E-value = 6,80E-44.

Значения при таком пороге:


на самом деле принадлежит подсемейству не принадлежит сумма
выше порога по профилю 12 41 53
ниже порога 2 3214 3216
сумма 14 3255 3269


Таблица Excel с информацией о белках, содержаших домен PF00034, а также данных для посроения roc-кривой.



© Широковских Татьяна