В данном практикуме требовалость найти гомологочные последовательности субъединице АТФ-зависимой протеазы из семейства CLP из организма E.coli. Вначале была скачана последовательность белка CLPX_ECOLI из базы данных Uniprot. Затем Для поиска гомологов была создана локальная база данных на основе протеомов 7 бактерий из предыдущего практикума:
cat *.fasta > proteomes.fasta makeblastdb -dbtype prot -in proteomes.fasta -out proteomes
Эта база данных подавалась на вход программе blastp с порогом на e-value 0.001:
blastp -query clpx_ecoli.fasta -db proteomes -evalue 0.001 -out clpx.blast
Результат работы blastp здесь.
Далее были выбраны идентификаторы белков, последовательности собраны из базы данных в новый файл.
while read line; do echo 'proteomes.fasta:'$line; done < names.txt > myprots.list seqret @myprots.list myprots.fasta
Выравнивание: muscle -in myprots.fasta -out myprotsalign.fasta
Реконструкция филогении была произведена с помощью программы MEGA с алгоритмом Maximum Likelihood. Было получено следующее дерево , визуализация которого отредактирована на сервесе iTOL:
Можно выделить две большие группы ортологов - АТФ-связывающие субъединицы Clp протеаз и АТФ-зависимые цинковые металлопротеазы (FtsH).Для первой группы можно отметить, что в неё вошли белки всех рассматриваемых организмов, но филогения белков не в точности соответствует филогении бактерий. Во второй группе присутствуют только 6 из 8 организмов, но филогения сохраняется.
Из найденных белков паралогами являются, например, NOCSJ_A1SJA7_Holliday_junction_ATP-dependent_DNA_helicase_RuvB и NOCSJ_A1SME0_ATP-dependent_Clp_protease_ATP-binding_subunit; CORDI_Q6NGK1_AAA_domain-containing_protein и CORDI_Q6NF92_ATP-dependent_zinc_metalloprotease_FtsH; ACIC1_A0LR74_ATP-dependent_zinc_metalloprotease_FtsH и ACIC1_A0LW31_AAA_ATPase_central_domain_protein.
Ортологи, например: BIFLO_Q8G3S2_ATP-dependent_zinc_metalloprotease_FtsH и BIFLO_Q8G3S2_ATP-dependent_zinc_metalloprotease_FtsH; NOCSJ_A1SJA7_Holliday_junction_ATP-dependent_DNA_helicase_RuvB и BIFLO_Q8G6B7_Holliday_junction_ATP-dependent_DNA_helicase_RuvB; BIFLO_Q8G5R1_ATP-dependent_Clp_protease_ATP-binding_subunit и RUBXD_Q1AVT0_ATP-dependent_Clp_protease_ATP-binding_subunit.