Эволюционные домены

  1. Выбор домена. Описание доменных архитектур белков, содержащих домен.

    В качестве семейств доменов с которым в дальнейшем будет вестись работа было выбрано семейство доменов SOCS_box.

    Описание выбранного домена из Pfam:

    В JalView выберем в меню "File"->"Fetch Sequence(s)". В качестве базы данных выберем PFAM (Full) и запросим PF07525. Используем раскраску "Clustalx", установив порог на консервативность, равный 30. Проект сохранили в файл, а также отдельно выравнивание.

  2. Выбор архитектур

    Получила таблицу с информацией об архитектуре всех последовательностей, содержащих выбранный домен с помощью скрипта swisspfam_to_xls.py. Составила список последовательностей с указанием доменной архитектуры. Использовала сводную таблицу в Excel: строки – AC последовательностей, столбцы – домены Pfam. Скачала полные записи всех последовательностей из Uniprot, запустила скрипт uniprot_to_taxonomy.py. Перенесла таксономию с основную таблицу.

    Итоговый документ:сводная таблица

    Для сравнения были выбраны следующие архитектуры (таблица 1).

    Таблица 1. Характеристика отобранных архитектур Pfam

    Архитектура Число представителей Описание второго домена Изображение
    SPRY + SOCS_box 155 Назван в честь рецепторов SPla/RYanodine, функция домена не определена
    Ras + SOCS_box 147 Осуществляют один из первых этапов передачи сигнала извне клетки, регулируют размножение клеток

    В качестве таксона внутри которого будет проводиться сравнение был выбран Metazoa, его крупными подтаксонами являются Ecdysozoa и Chordata.

    С помощью скрипта filter_alignment.py оставили только выбранные последовательности из выравнивания и таким образом получили файл , который открыли в JalView и отредактировали (удалили пустые колонки и несодержательные C- и N- концевые участки). Далее были созданы группы по архитектурам, в каждой из которых была выполнена раскраска последовательностей ClustalX с порогом консервативности 20%. Таким образом, в конечном файле выравнивания JalView осталось 136 последовательностей.

    Выравнивание в формате jar:group.jar

    Изображение выравнивания:group.png

  3. Построение дерева и выводы

    Построим филогенетическое дерево методом "UPGMA". Данный метод использует молекулярные часы (что весьма близко к реальной эволюции) и строит укоренённое дерево (можно предположить первоначальное разделение на подтаксоны). Подтверждение достоверности ветвей дерева проведём с помощью бутстрэп-анализа (число реплик = 500). Для построения была использована программа MEGA. Ниже приведены деревья:

    Original tree Bootstrap consensus tree

    Полученные деревья сходны между собой, однако имеются отличия в филогении последовательностей, соответствующих конкретным таксонам.

    Скобочная формула дерева:domain.nwk

    Таким образом, архитектура Ras + SOCS_box четко разпределилась между двумя подтаксонами, из чего можно сделать вывод, что Ecdysozoa и Chordata разделились раньше возникновения данной архитектуры. Что касается архитектуры SPRY + SOCS_box четкого разделения на подтаксоны нет, что указывает на архаичность данной структуры и возникновение её у общего предка всех подтаксонов Metazoa.


    © Evstafyeva Diana, 2012