Выбор домена

Для данной работы выбрала SH2 - Белковый домен SH2, позволяющий содержащим его белкам взаимодействовать с фосфорилированными тирозинами других белков. Белки, содержащие этот домен, обычно участвуют в передаче сигнала рецептору тирозин-киназы. Pfam AC PF00017, Pfam ID SH2. Домен входит в 9081 последовательность из 283 организмов, входит в 379 доменных архитектур, в базе данных PDB находится 390 трехмерных структур. Ниже приведено изображение каталитической субъединицы, содержащий данный домен (рис. 1). Страница домена в Pfam.

Рисунок 1. SH2, пространственная структура.

С помощью Jalview загрузила выравнивание домена. Ассоциировала структуру 2CR4 c 3BP2_HUMAN. Сделала раскраску по ClustalX и консервативность 13%. Сохранила выравнивание в формате .fasta и .jar.

Выбрала домены для дальнейшей работы.

домены входящие в архитектуру схема количество последовательностей
SH3_1, SH2, Pkinase_Tyr 865
PID, SH2 242

Ссылка на список архитектур в Pfam.

Описание доменов:

SH3_1- домен цитоплазматических тирозин-киназ и фосфолипаз, не входящий в их каталитические центры.
 ссылка в Pfam на домен SH2\3_1
      

Pkinase_Tyr- домен тирозин-киназны. 
 ссылка в Pfam на домен Pkinase_Tyr


PID- домен, взаимодействующий с фосфорилированным тирозином.
 ссылка в Pfam на домен PID

Выбор таксонов и подтаксонов: Для архитектуры SH2+SH3_1+Pkinase_Tyr было выбрано 12 последовательностей с систематикой Metazoa, Chordata и 13 с систематикой Metazoa, Ecdysozoa,3 с систематикой Metazoa, Platyhelminthes, 4 с систематикой Metazoa Porifera. Для архитектуры PID+SH2 было выбрано 24 последовательностей с систематикой Metazoa, Chordata и 15 с систематикой Metazoa, Ecdysozoa.

Получила таблицу с информацией об архитектуре всех последовательностей, содержащих выбранный домен с помощью скрипта swisspfam_to_xls.py. Составила список последовательностей с указанием доменной архитектуры. Использовала сводную таблицу в Excel: строки – AC последовательностей, столбцы – домены Pfam. Скачала полные записи всех последовательностей из Uniprot, запустила скрипт uniprot_to_taxonomy.py. Перенесла таксономию с основную таблицу. Далее выбрала таксоны, как описано выше.

Выбрала по 25 последовательностей из каждой выбранной выше архитектуры. С помощью скрипта filter_alignment.py оставила только выбранные последовательности из выравнивания. Далее открыла проект в JalView, удалила пустые колонки, создала группы по архитектурам (сверху находятся последовательности, взятые из белков с одним доменом, внизу - последовательности в архитектуре), удалила плохо выровненные участки. Сохранила выравнивание в формате .jar. Ниже привожу изображение выравнивания (ClustalX, консервативноcть 30%) (рис. 2).

Рисунок 2.Выравнивание отобранных последовательностей домена. Сверху выравнивание двудоменного белка, внизу - трехдоменного.

Исходя из выравнивания, все-таки можно понять, что большая консервативность в значимых участках - альфа-спиралях и бета-тяжах - существует. Наибольшая консервативность наблюдается у трехдоменных белков.