Домены. Pfam. HMM профиль.Задание 1. Построить выравнивание представителей домена Pfam белков с разной доменной архитектурой.Характеристика рассматриваемого домена:
В программе Jalview было скачано выравнивание всех последовательностей (File > Fetch Sequences > БД - Pfam (Full) > AC - PF08516). Далее выравнивание было раскрашено по консервативности, а также была добавлена одна 3D-модель (вот полученный проект, а вот он же в fasta-формате). Доменные архитектуры В Pfam нашлось 67 доменных архитектур, куда входит ADAM_CR
С помощью скрипта swisspfam_to_xls.py с сайта kodomo был получен файл с информацией о доменной архитектуре
каждой из последовательностей.
Далее с помощью различных фильтров доменов были выделены лишь белки, соответствующие выбранным архитектурам.
Затем через функцию Retrieve в Uniprot был скачен text-файл, с помощью которого в дальнейшем была найдена таксономия
организмов, которым принадлежит белок.
Данные из этого файла были добавлены на страницу таблицы Excel с отобранными белками. Далее от каждого домена было отобрано ~ по 15 белков от типов Ecdysozoa и Chordata (в финальном варианте таблицы Excel зелёным выделены Ecdysozoa,
а сиреневым - Chordata). Их последовательности были скачены также через Retrieve в Uniprot.
С помощью программы JalView было построено выравнивание выбранных белков, обрезаны только участки, соответствующие желаемому домену, для наглядности
аминокислотные остатки были раскрашены по консервативности.
В выравнивании я не стала удалять концевые участки, так как для представителей группы X|Ecdys (белков Ecdysozoa с доменной архитектурой X), если верить
выравниванию, характерны протяжённые индели в этих позициях. Эта закономерность показалась мне интересной, поэтому концевые участки остались нетронутыми.
| |||||||||||
Задание 2. Построить филогенетическое дерево последовательностей домена.На основе выравнивания в программе MEGA было построено дерево методом Minimum-Evolution с дополнительным параметром Bootstrap method: 100 реплик.
Скобочная формула дерева: здесь. По полученному дереву сложно однозначно судить о ходе эволюции домена. Однако заметно, что всё дерево можно разделить на клады, составленные, за редким исключением, белками одной доменной архитектуры. Клады с доменной архитектурой Х выделены на Рис.2 зелёным цветом, клады с архитектурой Y - голубым. Можно предположить, что разделение двух доменных архитектур произошло у общего предка Ecdysozoa и Chordata, и эволюция домена шла независимо в рамках своей доменной архитектуры. |
© Svetlana Kozyulina 2018