Целью данного практикума является поиск достоверных гомологов белка CLPX_ECOLI (ATP-dependent Clp protease ATP-binding subunit ClpX). Поиск гомологичных белков я проводила по организмам, указанным в Таблице 1.
Название | Мнемоника |
Geobacillus kaustophilus | GEOKA |
Lactococcus lactis subsp. cremoris | LACLA |
Moorella thermoacetica | MOOTA |
Clostridium tetani | CLOTE |
Bacillus subtilis | BACSU |
Listeria monocytogenes serovar 1/2a | LISMO |
Staphylococcus aureus | STAA8 |
Для начала я получила полные протеомы исследуемых бактерий и объединила их в один файл. Затем я произвела поиск гомологов при помощи программы blastp. Команда выглядела следующим образом (предварительно была создана база данных белков, основанная на этих протеомах):
blastp -query clpx_ecoli.fasta -db proteomes -evalue 0,001 -out clpx_blastp
Список находок blastp можно увидеть в таблице .
Для реконструкции дерева я собрала в один файл белки, найденные blastp. Выравнивание было произведено в программе MEGAX при помощи алгоритма Musсle для белков. Анализ филогении я проводила методом Neighbor-Joining со стандартными параметрами запуска.
С формулой дерева в Newick-формате можно ознакомиться по ссылке
Белки называются ортологами, если они принадлежат разным организмам и их разделение произошло в результате видообразования. Примерами ортологов среди данных органимов могут служить FTSH_BASCU и FTSH_LACLA, HSLU_GEOKA и HSLU_STAA8, CLPX_LISMO и CLPX_CLOTE.
Белки называются паралогами, если они являются гомологичными белками одного организма. Примерами паралогов являются следующие пары: HSLU_GEOKA и Q5KZ67_GEOKA, Q2RLR4_MOOTA и Q2RM95_MOOTA, Q895L6_CLOTE и CLPX_CLOTE.
На Рисунке 1 можно увидеть группы ортологичных белков. Для наглядности, ортологичные группы из более, чем 2 белков, выделены цветом.
На Рисунке 2 ортологичные группы схлопнуты, чтобы изображение было менее громоздким. Рассмотрим каждое поддерево отдельно: