Эволюционные домены
В качестве семейств доменов с которым в дальнейшем будет вестись работа было выбрано семейство доменов SOCS_box.
Описание выбранного домена из Pfam:
В JalView выберем в меню "File"->"Fetch Sequence(s)". В качестве базы данных выберем PFAM (Full) и запросим PF07525. Используем раскраску "Clustalx", установив порог на консервативность, равный 30. Проект сохранили в файл, а также отдельно выравнивание.
Получила таблицу с информацией об архитектуре всех последовательностей, содержащих выбранный домен с помощью скрипта swisspfam_to_xls.py. Составила список последовательностей с указанием доменной архитектуры. Использовала сводную таблицу в Excel: строки – AC последовательностей, столбцы – домены Pfam. Скачала полные записи всех последовательностей из Uniprot, запустила скрипт uniprot_to_taxonomy.py. Перенесла таксономию с основную таблицу.
Итоговый документ:сводная таблица
Для сравнения были выбраны следующие архитектуры (таблица 1).
Таблица 1. Характеристика отобранных архитектур Pfam
Архитектура | Число представителей | Описание второго домена | Изображение |
SPRY + SOCS_box | 155 | Назван в честь рецепторов SPla/RYanodine, функция домена не определена | |
Ras + SOCS_box | 147 | Осуществляют один из первых этапов передачи сигнала извне клетки, регулируют размножение клеток |
В качестве таксона внутри которого будет проводиться сравнение был выбран Metazoa, его крупными подтаксонами являются Ecdysozoa и Chordata.
С помощью скрипта filter_alignment.py оставили только выбранные последовательности из выравнивания и таким образом получили файл , который открыли в JalView и отредактировали (удалили пустые колонки и несодержательные C- и N- концевые участки). Далее были созданы группы по архитектурам, в каждой из которых была выполнена раскраска последовательностей ClustalX с порогом консервативности 20%. Таким образом, в конечном файле выравнивания JalView осталось 136 последовательностей.
Выравнивание в формате jar:group.jar
Изображение выравнивания:group.png
Построим филогенетическое дерево методом "UPGMA". Данный метод использует молекулярные часы (что весьма близко к реальной эволюции) и строит укоренённое дерево (можно предположить первоначальное разделение на подтаксоны). Подтверждение достоверности ветвей дерева проведём с помощью бутстрэп-анализа (число реплик = 500). Для построения была использована программа MEGA. Ниже приведены деревья:
Original tree | Bootstrap consensus tree |
Полученные деревья сходны между собой, однако имеются отличия в филогении последовательностей, соответствующих конкретным таксонам.
Скобочная формула дерева:domain.nwk
Таким образом, архитектура Ras + SOCS_box четко разпределилась между двумя подтаксонами, из чего можно сделать вывод, что Ecdysozoa и Chordata разделились раньше возникновения данной архитектуры. Что касается архитектуры SPRY + SOCS_box четкого разделения на подтаксоны нет, что указывает на архаичность данной структуры и возникновение её у общего предка всех подтаксонов Metazoa.