Работа с Pfam

1. Поиск информации по домену SapB_2


В данном практикуме производится ознакомление с работой в Pfam. В качестве семейства доменов, для которого происходит поиск информации, выступает SapB_2, уже затрагивавшийся в практикуме 12. Домены SapB_2 почти всегда присутствуют в парах с SapB_1. Это сапозин-подобные домены, служащие в сапозтинах активаторами в реакциях липидов в лизосомах. Предположительно, они изолируют липидный субстрат от мембранного окружения. В других белках они могут помогать производить взаимодействия с мембранами.

Основная информация о семействе доменов представлена в Таблице 1. Приятели – наиболее часто сопутствующие домены. На Рис. 1 представлен пример архитектуры с такими доменами.

Таблица 1. Информация о SapB_2
ID AC Число последовательностей Architectures Structures HMM Приятели Представленность
Full Seed Последнее изменение Число позиций Viridiplantae Metazoa Archaea No kingdom Uncategorised ukaryote
SapB_2 PF03489 521 3383 175 52 февраль 2015 34 SapB_1; SapA 787 884 1 120 156

Рисунок 1. Архитектура, SapB_2 (синий) с "приятелями" SapB_1 (красный) и SapA (зелёный)

2.Анализ выравнивания из Pfam

В этом пункте будет проводиться анализ выравнивания последовательностей, представленных в отряде Rodentia (Eukaryota->Metazoa->Chordata->Mammalia). Для этого был скачан Pfam.fa с 84 последовательностью из 22 видов, после чего с помощью muscle было проведено множетсвенное выравнивание, отредактированное в программе Jalview. Проект можно найти в файле pr13.jpv. К сожалению, выполнение практикума сопровождали различные трудности. Так, например, не получилось найти таксон с подходящими для задачи характеристиками, вследствие чего последовательностей много и они очень схожи.

Если мы посмотрим на выравнивание, то заментим, то структуры в целом крайне консервативны. Послежовательности идентичны друг другу почти полностью. Это мешает выделить удобный небольшой консервативный, полуконсервативнымй и минус- блоки. Примером полной консервативности может услужить блок, образованный 524-536 столбцами выравнивания.

Примером полуконсервативного блока может являться участок, представленный 607-612 столбцами (см. Рис.2). Минус-блок представлен на Рисунке 3.

Рисунок 2. Проект Jalview

Рисунок 3. Минус-блок

3. Поиск всех белков с данным доменом

На сайте UniProt был осуществлён поиск белков с рассматриваемым доменом. Для этого в поисковой строке был введён запрос "database:(type:pfam pf03489)". В Таблице 2 представлена информация о выдаче, с которой можно ознакомиться в файле pr13.xlsx.

Таблица 2. Поиск содержащих SapB_2 белков в UniProt
Объект Число находок Reviewed cross-reference(Pfam) cross-reference(PROSITE)
Viridiplantae Metazoa Archaea
домен 4257 34 1954/10(sw) 2081/20 1/0 -

Далее должна производиться работа с доменной архитектурой, но я не понял, что именно требуется сделать.

Комментарии к заданию и выводы

Несмотря на кажущуюся лёгкость (задания небольшие и относительно лёгкие), практикум сопровождался огромным количеством сложностей. Показанное на сайте Pfam количество последовательностей для домена по таксонам отличается от того, что наблюдается при скачивании файла. При этом скачивание происходило через раз, но это могут быьб персональные проблемы, а не огрехи сайта. Большое количество последовательностей затрудняло ревизию, поиски и визуализацию. Мне кажется, что Pfam скорее вспомогательный инструмент с ограниченными возможностями, чем нечто самостоятельное (как, например, UniProt).