Деревья

Подготовка данных

Для дальнейшей работы были взяты геномы бактерий из предыдущих практикумов(из-за технических проблем, некоторые ID пришлось поменять):CLOTE GEOKA LACAC LACLA MOOTA STAA8 STRPN.

Использованные команды

Команда или действие Описание
cat CLOTE.fasta GEOKA.fasta LACAC.fasta LACLA.fasta MOOTA.fasta STAA8.fasta STRPN.fasta > united.fasta Слияние всех фаста файлов в один, для более удобного инпута в бласт.
makeblastdb -in united.fasta -dbtype prot Индескирование последовательностей, создание банка данных
blastp -task blastp -evalue 0.001 -query P0A6H1.fasta -db united.fasta -out blast_out.fasta Поиск находок при помощи BLAST в самодельном банке.Выдача бласт
поиск ID находок в UniProt, скачивание последовательностей Файл с последовательностями
выравнивание в JalView при помощи алгоритма Muscle с параметрами по умолчанию. Файл с выравниваниями

Построение дерева

При помощи программы MEGA7 было построено дерево с использованием Maximum Likelihood и с bootstrep 100.

Newick: ((((((((((FTSH|STRPN/1-652:0.12511576,Q5FMA3|LACAC/1-718:0.12350161)0.9200:0.07132451,FTSH|LACLA/1-695:0.08864106)0.9600:0.11320386,Q891B9|CLOTE/1-624:0.39619320)0.3100:0.05389484,(Q5L3T1|GEOKA/1-632:0.08192238,(Q899H3|CLOTE/1-603:0.17809863,Q2RM95|MOOTA/1-645:0.10024791)0.3400:0.06181193)0.3200:0.02321511)0.9500:0.17814300,Q898D1|CLOTE/1-576:0.45185266)0.6800:0.15217777,Q2RJJ8|MOOTA/1-494:0.42900941)0.7800:0.24144277,Q2RLP6|MOOTA/1-415:0.66794224)0.5700:0.11345686,Q2RLR4|MOOTA/1-370:1.06802622)0.9400:0.68490776,(CLPL|STAA8/1-701:0.16792436,(Q5L436|GEOKA/1-810:0.31732507,(Q5FHW6|LACAC/1-709:0.28693394,CLPE|LACLA/1-748:0.20364869)0.6200:0.13502216)0.6400:0.16079645)1.0000:1.15058811)0.2100:0.07821541,((Y1413|STAA8/1-263:0.04994134,Q5KZ67|GEOKA/1-291:0.49749440)1.0000:0.92041163,((((HSLU|LACAC/1-466:0.36879282,HSLU|STAA8/1-467:0.31780653)0.3100:0.12448020,HSLU|GEOKA/1-465:0.14760981)0.2400:0.10605042,Q2RJP5|MOOTA/1-461:0.34192051)1.0000:0.71922317,(((CLPX|LACLA/1-411:0.04865594,CLPX|STRPN/1-410:0.08038682)0.9100:0.08442238,CLPX|STAA8/1-420:0.13640187)0.4300:0.04111045,(Q5FKR6|LACAC/1-420:0.18389741,(CLPX|GEOKA/1-421:0.08575489,(CLPX|CLOTE/1-431:0.15019775,CLPX|MOOTA/1-419:0.08209321)0.9300:0.08678526)0.4800:0.03724199)0.1000:0.00000000)0.7400:0.29273277)0.9100:0.39660196)0.4200:0.08547345,(Q5KUR3|GEOKA/1-508:2.74957493,Q895L6|CLOTE/1-524:0.00000010)0.9600:3.02987974);

Пары паралогов:
Q891B9|CLOTE + Q899H3|CLOTE
Q2RJJ8|MOOTA + Q2RLP6|MOOTA
CLPX|GEOKA + HSLU|GEOKA
Пары ортологов:
CLPX|LACLA + CPLPX|STRPN
HSLU|STAA8 + HSLU|GEOKA
FTSH|STRPN + Q5FMA3|LACAC


Рисунок 1. Выдача BLAST


Рисунок 2. Раскраска дерева по ортологичным группам


Рисунок 3. "Схлопнутое" дерево

Описания групп ортологов

HslU(красная группа) является шапероном, распознающим, разворачивающим и преносящим белки-субстраты внутрь полости протеазной части. HslU, является членом обширного семейства ААА АТФаз.
Отсутствует у: CLOTE LACLA MOOTA STRPN

ClpX(синяя группа)-это АТФ-зависимый шаперон, который может распознавать белковые субстраты, связываясь с метками деградации белка. Являясь важным компонентом Протеазного комплекса ClpP, ClpX рекрутирует разлагаемые субстраты и разворачивает их третичную структуру. Впоследствии эти шапероны ClpX переносят белковые субстраты в протеолитическую камеру, образованную тетрадекамером ClpP.
Присутствует у всех

ftsH(фиолетовая группа)-Действует как процессивная, АТФ-зависимая цинковая металлопептидаза как для цитоплазматических, так и для мембранных белков. Играет важную роль в контроле качества интегральных мембранных белков.
Можно заметить пару паралогов внутри группы попарных ортологов, поскольку они объеденены одним белком, я решил объединить их все таки в одну группу.
Отсутствует у: STAA8

ClpP(зеленая группа) способен расщеплять полноразмерные белки. Полностью функциональная Clp-протеаза требует участия AAA+ АТФазы. Эти шапероны ClpX распознают, разворачивают и переносят белковые субстраты в протеолитическое ядро, образованное Тетрадекамером ClpP.
Отсутствует у: STAA8 MOOTA CLOTE STRPN