практикум №4

методы

Практические аспекты реконструкции филогении


Составление списка гомологичных белков, включающих паралоги.

Для выполнения практикума было выбрано 7 протеомов бактерий отдела Pseudomonadota: Aromatoleum aromaticum (AROAE), Brucella suis (BRUSU), Haemophilus influenzae (HAEIN), Pasteurella multocida (PASMU), Pseudomonas aeruginosa (PSEAE), Roseobacter denitrificans (ROSDO), Shewanella denitrificans (SHEDO). На основе данных протеомов командой makeblastdb была создана белковая база для поиска гомологов субъединицы сериновой протеазы из E. coli (CLPX_ECOLI). Поиск проводился программой blastp с порогом на e-value равным 0,0001. Ознакомиться со списоком находок из выдачи BLAST можно по ссылке. Из 16 находок только одна имеет статус непросмотренной (имеет в имени tr, что говорит о принадлежности к базе данных TrEMBL).

Последовательности находок с ID получены из общего файла протеомов, по которому создавалась белковая база, с помощью скрипта.

Реконструкция и визуализация.

Для реконструирования дерева найденных гомологов последовательности были выравнены программой muscle. Затем выравнивание было переведено в формат phylip-relaxed с помощью пакета BioPython. Непосредственно реконструкция проводилась программой FastME с использованием модели p-distance (формула Newick). Дерево было визуализировано в сервисе iTOL и укорененно в среднюю точку.

Таблица 1. Ортологи и паралоги, являющиеся гомологами белка CLPX_ECOLI в исследуемых бактериях. Пары соответствуют столбцам.
Ортологи HSLU PASMU CLPX PSEAE CLPX BRUSU
HSLU HAEIN CLPX SHEDO CLPX ROSDO
Паралоги HSLU PASMU HSLU ROSDO HSLU AROAE
CLPX PASMU CLPX ROSDO CLPX AROAE