Практикум 4

Составление списка гомологичных белков, включающих паралоги

Для выполнения данного практикума были отобраны протеомы следующих бактерий из директории /P/y22/term4/Proteomes (ниже приведены их мнемоники):

Далее для подготовки протеомов к запуску программы blastp все выбранные файлы были объединены в один, используя следующую команду (работа проводилась в отдельной директории):

cat /P/y22/term4/Proteomes/ACICJ.fasta /P/y22/term4/Proteomes/BARHE.fasta /P/y22/term4/Proteomes/BURMA.fasta /P/y22/term4/Proteomes/NEIMA.fasta /P/y22/term4/Proteomes/POLAQ.fasta /P/y22/term4/Proteomes/PSEMY.fasta /P/y22/term4/Proteomes/SACD2.fasta > alls.fasta

На основе полученного файла была создана локальная база данных для запуска blastp с помощью команды:

makeblastdb -in alls.fasta -dbtype prot

Затем для поиска гомологичных белков был запущен blastp, в качестве запроса использовалась последовательность белка с мнемоникой CLPX_ECOLI (файл query.fasta). Для отбора достоверных находок установлен порог на E-value в 0.0001:

blastp -task blastp -query search.fasta -db alls.fasta -out blast.out -evalue 0.0001

В результате был получен следующий список находок

Реконструкция и визуализация

После получения списка находок были собраны в один файл fasta-файлы соответствующих последовательностей. Затем было проведено множественное выравнивание с помощью программы muscle. Полученное выравнивание было преобразовано в формат .phy (при помощи скрипта), и на его основе построено филогенетическое дерево с использованием программы FastME, модели MtREV и 100 бутстреп-реплик. Действия повторяют схему, использованную в предыдущих практикумах.

Дерево FastME
Рис. 2. Реконструкция дерева, выполненная программой FastME с моделью MtREV и 100 бутстреп-репликами.

На Рис. 3 показано дерево, где разными цветами выделены ортологические группы (наборы попарно ортологичных белков, не менее 4 последовательностей в группе). В данном анализе выделились две группы: группа белка CLPX и группа белка HSLU. Также на дереве видны примеры пар ортологов и паралогов:

Дерево с цветовой маркировкой групп
Рис. 3. Дерево, где разными цветами выделены ортологические группы.

На Рис. 4 показано дерево с схлопнутыми (collapsed) ортологическими группами. Обе группы содержат последовательности всех 7 выбранных бактерий, что позволяет оценить соответствие реконструкции групп ортологов с филогенией бактерий (сравнение с эталонным деревом):

Дерево с схлопнутыми группами
Рис. 4. Дерево, где схлопнуты ортологические группы: группа HSLU (все бактерии) и группа CLPX (также все бактерии).