Для выполнения практикума было выбрано 7 протеомов бактерий отдела Pseudomonadota: Aromatoleum aromaticum (AROAE), Brucella suis (BRUSU), Haemophilus influenzae (HAEIN), Pasteurella multocida (PASMU), Pseudomonas aeruginosa (PSEAE), Roseobacter denitrificans (ROSDO), Shewanella denitrificans (SHEDO). На основе данных протеомов командой makeblastdb была создана белковая база для поиска гомологов субъединицы сериновой протеазы из E. coli (CLPX_ECOLI). Поиск проводился программой blastp с порогом на e-value равным 0,0001. Ознакомиться со списоком находок из выдачи BLAST можно по ссылке. Из 16 находок только одна имеет статус непросмотренной (имеет в имени tr, что говорит о принадлежности к базе данных TrEMBL).
Последовательности находок с ID получены из общего файла протеомов, по которому создавалась белковая база, с помощью скрипта.
Для реконструирования дерева найденных гомологов последовательности были выравнены программой muscle. Затем выравнивание было переведено в формат phylip-relaxed с помощью пакета BioPython. Непосредственно реконструкция проводилась программой FastME с использованием модели p-distance (формула Newick). Дерево было визуализировано в сервисе iTOL и укорененно в среднюю точку.
Ортологи | HSLU PASMU | CLPX PSEAE | CLPX BRUSU |
HSLU HAEIN | CLPX SHEDO | CLPX ROSDO | |
Паралоги | HSLU PASMU | HSLU ROSDO | HSLU AROAE |
CLPX PASMU | CLPX ROSDO | CLPX AROAE |