Гомология и выравнивание: исследование семьи белковых доменов
Вот характеристики выбранной мной семьи белковых доменов:
Название, оно же ID: VMAP-M0
AC: PF19916
Краткое описание: Средняя область белка, ассоциированного с vWA доменом.
Домен vWA обнаружен в различных белках плазмы крови: факторах комплемента B, C2, CR3 и CR4;
интегринах (I-домены); коллагенах VI, VII, XII и XIV типов; и других внеклеточных белках.
Хотя большинство vWA-содержащих белков являются внеклеточными, наиболее древние из них, присутствующие у всех эукариот,
являются внутриклеточными белками,
участвующими в таких функциях, как транскрипция, репарация ДНК, рибосомальный и мембранный транспорт[1].
Домен vWA является очень распространенным в живом мире, он встречается у Бактерий, Архей и у Эукариот, у Эукариот он есть у всех
или почти во всех царствах и отделах. Существуют также vWA-подобные домены.
Число последовательностей в выравнивании seed: 66
Общее число последовательностей (full): 212
Мне не удалось найти белки с этим доменом с известной 3D-структурой
Дата создания HMM: Февраль 2015
Число позиций в HMM: 104
Число доменных архитектур с этим доменом: 17
Все белки семейства встречаются только у бактерий: 152 последовательности известно для Actinobacteria, остальные для бактерий ранообразных фил.
Далее я выбрал две многочисленные доменные архитектуры:
При помощи Blastp для двух последовательностей я получил DotPlot двух белков семействас разной архитектурой: по вертикали
отложена последовательность домен-содержащего белка трипсиноподобной пептидазы (ID: A0A4V5MIV7_9ACTN),
а по горизонтали "Нехарактерного белка Streptomyces davaonensis" (ID: K4R7Y2_STRDJ) (Рисунок 1).
Видно что выровненная последовательность в обоих белках очень схожа, разрывы в линии на графике связаны с всавками или выпадениями
нескольких нуклеотидов в одной или другой цепи.
Рисунок 1. Dotplot.
Задание 3
Я решил работать с seed. Я выделил из него две большие подгруппы, белки из которых обладают некоторыми
характерными консервативними позициями в seed-выравнивании.
При помощи JalView я построил филогенетическое древо белков в seed и выделил две крупные ветви.
Последовательности, оставшиеся вне этих ветвей имеют различия по рассмытриваемым позициям с обеими подгруппами.
Рисунок 2. Эволюционное древо белков из seed.Рисунок 3. Фрагмент выравнивания.
В таблицу 1 я внёс различия между верхней (самой многочисленной) подгруппой, второй выделенной и остальными. Наличие этих различий
как раз является обоснованием разделения на подгруппы.
Таблица 1. Различия в последовательностях белков разных подгрупп.