Семестры
Сайт ФББ МГУ
Kodomo Wiki
NCBI

RanHummer personal web-site


Семейства белковых доменов


Для выполнения заданий данного практикума была взята аминокислотная последовательность белка Mutator MutT из Mesorhizobium opportunistum WSM2075. Проект JalView

Задание 1. Поиск доменов Pfam в последовательности моего белка.

Pfam - база данных, содержащая информацию о выравниваниях белковых доменов. Для выполнения данного задания было необходимо осуществить поиск доменов по последовательности белка на сайте Pfam в разделе Sequence search. По умолчанию отбор производится по порогу E-value = 1.0 (Условия поиска).

Была найдена всего одна Pfam A находка, поиск по Pfam B не производился (Pfam A содержит курируемые данные, а Pfam B - некурируемые). Было найдено семейство Nudix, входящее в клан NUDIX (CL0261), содержащий фосфогидролазы. Используя воду в качестве посредника, члены этого семейства катализируют разрыв фосфатной связи в субстрате, получая два продукта. Есть два компонента семейства Nudix: так называемая Nudix-складка бета-листа с альфа-спиралями с каждой стороны и мотива Nudix (GXXXXXEXXXXXXXREUXEEXGU где U- изолейцин, лейцин, валин или и Х представляет собой любую аминокислоту), который содержит каталитические и металл-связывающие аминокислоты.

С данным семейством было найдено одно совпадение входной последовательности длиной 135 остатка, другие характеристики находки: Bit Score = 86.8, E-value = 9.1e-25.

Был сохранен Seed данного семейства (ссылка Alignments), содержащий 197 последовательностей (всего же последовательностей 43912), в формате fasta.

Также было получено изображение Seed в JalView (окно Seed), которое можно увидеть и на Рис. 1.

Рис. 1. Seed семейства Nudix. Раскраска ClustalX.

Задание 2.

Также я выбрал в данном выравнивании несколько колонок (148-155) в качестве блока (на Рис. 2 и в окне JalView block)

Рис. 2. Изображение блока из колонок выравнивания Seed в JalView.

Блок в формате fasta.

По последовательностям на участке данного блока на сервере Weblogo был получен logo данного мотива, показывающий распространенность различных остатков в каждой из позиций (Рис. 3).

Рис. 3. Logo мотива, соответствующего выбранному блоку.

Также из загруженного в JalView выравнивания Seed была сохранена консенсусная последовательность блока:

Задание 4.

В данном задании, основываясь на полученном в прошлом задании logo, а также на полученном с помощью программы MEME (Рис. 4) , я составил сильный и слабый паттерны для поиска последовательностей, содержащих мотив с данным паттерном, по базе данных Swiss-Prot на сервере http://prosite.expasy.org/scanprosite.

Рис. 4. Logo мотива, найденного MEME.

Сильный паттерн призван находить только гомологичные находки, что может достигаться усилением позиций и жертвой некоторых находок.

Составить сильный паттерн по logo длиной всего 8 (и даже 11 по версии MEME) остатков является непростой задачей, так как крайне высока вероятность, что такой короткий мотив будет найден в огромном количестве негомологичных последовательностей. Задачу усугубляет то, что не все позиции данного участка достаточно консервативные, то есть, имеется достаточно много вариантов даже среди последовательностей семейства, что не позволяет найти только гомологов. Для поиска среди последовательностей Seed'а использовался сервис FIMO (p-value <= 1E-4).

Слабый паттерн призван находить все находки, содержащие данный мотив (в том числе большое количество негомологичных находок).

Табл. 1. Количество находок по паттернам в SwissProt
Сила паттерна Паттерн Число находок в SwissProt Число находок в Seed (max = 197)
Сильный [ATCGVN][ALVI][VRLAI]RE[LVAIT][EKR]EE[LVAIT]G 87 187
[ATCGVN][ALVI][VRLAI][RK][ERK][LVAIT]XEE[TLVAI][GN] 295 185
[ATCGVN][ALVI]XRE[LVAIT]XEEXG 391 188
[ATCGVN][ALVI]X[RK][ERK][LVAIT]XEE[TLVAI][GN] 470 182
[ATCGVN][ALVI]X[RK][ERK][LVAIT]XEEX[GNQ] 744 182
Очень слабый [RK][ERK][LVAIT]XEE[TLVAI][GN] 1708 178

К сожалению, количество включений из других семейств значительное, что происходит за счет того, что выбранный блок содержит много малоконсервативных позиций, различающихся даже внутри семейства.


© Поляков Игорь aka RanHummer