Учебный сайт Ксении Худяковой

Главная > Семестры > Семестр 2 > Практикум 13

Практикум представлен в виде Jalview проекта.

Задание 1. Для того, чтобы обнаружить, домены каких семейств содержит мой белок, я запустила поиск по БД Pfam. Был найден только один домен, относящийся к семейству Aminotran_5. Результат запроса показан на рис.1.

Рис.1. Доменная структура белка цистеиновой десульфуразы (Pfam).

Задание 2.

Консенсусная последовательность всего белка сохранена в файле consensus.fasta. Для построения LOGO был найден вертикальный блок с 2 по 23 позиции - см. рис. 2. Консенсус выбранного блока: consensus2-23.fasta. LOGO построено с помощью сервиса http://weblogo.berkeley.edu/.

Рис.2. LOGO вертикального блока (участок 2 - 23 позиции).

Задание 4.

Скачанный seed семейства можно посмотреть во вкладке seed Jalview-проекта. Для построения сильного паттерна я удалила около половины последовательностей, которые показались мне плохо подходящими под мотив. Использовала почти тот же блок, что и для LOGO (урезанный с правой стороны на три колонки). Сильный паттерн: [YW]-[LF]-D-X-[AGS]-[ASN]-[TS]-X(2)-[KRT]-P-X(2)-[VL]-X(2) . 88 находок, все из них цистеиновые десульфуразы. Это хороший результат, правда, аминотрансферазы - белки, так же принадлежащие этому семейству, не найдены. Это характерный недостаток сильного паттерна.

При использовании слабого паттерна по идее должно быть не меньше 11633 находок, потому что столько белков принадлежит семейству Aminotran_5. При составлении запроса я руководствовалась следующими соображениями: в сайте нужно указывать все аминокислоты, которые встречаются в исходном seed'e; если в сайте много разных аминокислот, то он нестабилен, и пусть там будет Х. Попробовав разные запросы, я остановилась на этом: [YW]-[LF]-D-X(2)-[ASNG]-[TSP]-X(2)-[KRTIVL], укоротив таким образом выбранный ранее мотив. Нашлось 1253 последовательности. Результат явно не включает всех представителей семейства Aminotran_5. Я думаю, это семейство нетипично большое, поэтому разнородность велика. Так же возможно, что я выбрала неудачный блок, то есть тот, который среди всех одиннадцати тысяч белков недостаточно консервативен. Среди находок встречаются и явно негомологичные белки, например NADPH--cytochrome P450 reductase. Это характерный недостаток слабого паттерна.