Из директории /P/y22/term4/Proteomes на kodomo были выбраны полные протеомы 8 бактрий отдела Pseudomonadota, со следующими мнемониками:
В выбранных протеомах найдем достоверные гомологи белка CLPX_ECOLI.
Объединим протеомы в один файл:
cat /P/y22/term4/Proteomes/ACICJ.fasta /P/y22/term4/Proteomes/BRUSU.fasta /P/y22/term4/Proteomes/POLAQ.fasta /P/y22/term4/Proteomes/THIDA.fasta /P/y22/term4/Proteomes/NEIMA.fasta /P/y22/term4/Proteomes/ROSDO.fasta /P/y22/term4/Proteomes/PASMU.fasta /P/y22/term4/Proteomes/PSEMY.fasta > bact.fasta
Создадим базу данных для blast:
makeblastdb -in bact.fasta -dbtype prot -out my_db
Проведем blastp:
blastp -db my_db -query CLPX_ECOLI.fasta -out results -evalue 0.0001
Список находок из выдачи BLAST
Реконструируем дерево найденных гомологов (рис 1) (скобочная формула Newick).
Укажем несколько пар ортологов ((белки из разных организмов, которые разделились при видообразовании)):
Несколько пар паралогов(два гомологичных белка из одного организма):
Раскрасим ортологичные группы в разные цвета (рис 2).
Схлопнем монофилетическую группу ортологов CLPX (рис 3). Туда попадает все 8 рассматриваемых бактерий. Группа ортологов HSLU содержит 4 бактерии (BRUSU, ROSDO, PSEMY, PASMU). Однако эта группа реконструировалась как парафилетическая, поэтому схлопнуть эти белки на дереве не получится.
Сравним нашу реконструкцию с референсным деревом (рис 4).
Ортологическая группа HSLU представлена двумя кладами из двух листьев (BRUSU,ROSDO) и (PSEMY,PASMU), что соответсвует дереву на рис 4.
С анализом ортологической группы CLPX все немного сложнее.
Нет ни одной клады, которая по топологии была бы верно реконструирована. Есть клада (BRUSU,ROSDO,ACICJ), у которой достаточно большой бутстреп, и не зря, потому что на референсном дереве она тоже присутствует. Но топологически даже эта клада реконструирована неверно. Должны BRUSU и ROSDO образовывать кладу, а у нас ROSDO и ACICJ (но бутстреп этой ветви маленький, что подтвержает возможную недостоверность). В том числе эта группа из 3х организмов должна быть базальной ко всем остальным, а у нас это не соблюдается. Реконструкция остальных ветвей получилась с совершенно другой топологией, чем должна была, и с низкими бутстсрепами (даже есть ветвь с бутстрепом 1 - совсем плохо).