Практикум 11
Задание 1
Для практикума я выбрал семейство Mrr_cat_2
Задание 2
ID: Mrr_cat_2 ; AC: PF13156
Функция: Участие в ферментативном расщеплении ДНК в системах рестрикции-модификаци
Full: 391
Seed: 33
Доменнах архитектур 22. Среди них я выбрал :
Y0KHD8_9PROT , содержащий 154 белка и состоящий из Mrr_cat_2 ,ResIII (PF04851) ,Helicase_C (PF00271) ,N6_Mtase (PF02384) ,Type_ISP_C (PF18135)
N0E5R3_9MICO , содержащий 82 белка и состоящий из Mrr_cat_2 ,ResIII (PF04851) ,Helicase_C (PF00271) ,Type_ISP_C (PF18135)
Для данного белка известна "A0A0M3KL05_LACLC" 3D структура.
Данный домен встречается у 353 видов бактерий . Из них 88 видов относятся к актинобактериям ,84 к протеобактериям ,28 к бактероидам ,18 к фирмикутам , остальное распределение по отделам бактерий единчно .122 вида некатегоризированы
Интересно ,что данный домен ,как оказалось ,встречается не только у бактерий .Данный домен также встречается у 3 видов вирусов .Возможно ,эти вирусы используют системы рестрикции для атаки бактерий . О подобном механизме вирусов я прочитал здесь.
Домент встречается у 5 видов архей и 2 видов ЭУКАРИОТ ,а именно - грибов .Этот домен встречается у представителя сахаромицет , который способен активно сбраживать сахар и у представителя гломеромицет ,которые образуют арбускулярную микоризу. В дальнейшем думаю развить тему ,зачем им домены рестрикции.
Дата создание HMM профиля - 18 октября 2021 года. В профиле 127 позиций.
3. Постройте карту локального сходства (Dot Plot) двух белков с доменом семейства, но с разной доменной архитектурой
Для построения карты локального сходства я выбрал упомянутые выше доменные ахитектуры.
По вертикальной оси располагается остаток белка N0E5R3_9MICO , а по горизонатльной - Y0KHD8_9PROT .На профиле видны разрывы - это гэпы и индели.
4. В выравнивании доменов семейства выделите на основании сходства две подгруппы доменов Pfam
Я скачал выравнивание из 391 последовательности .Сократил число последовательностей исключнием избыточных с порогом идентичности 88% , тем самым оставив лишь 88 последовательностей .( если снизить порог на 90 , то последовательностей останется 131, если 80 , то последовательностей вовсе останется лишь 3)
В результате построения дерева можно выделить 1 крупную группу , 2 "средних" и одну группу из 2 последовательностей.
У более мелких групп до 45 колонки (исключая 45) ,как правило , имеются еще 5-6 аминокислотных остатков. У большинcтва последовательностей из крупной группы эта местность пустует.
У малиновой группы в 49 коллонке преобладает пролин , у розовой 3/7 также содержат пролин ( остальное гэпы ) , у пепельной и желтой там гэпы.
В 61 коллонке у малиновой ,розовой и желтой группах преобладаеТ валин , а у пепельной - изолейцин
В 84, 85, 87 коллонках консервативна лишь пепельная группа
193 коллонка пепельной группы полностью заполнена лейцином ,а в желтой и малиновой преобладает братский изолейцин .
В колонках 207-209 в малиновой группе преобладает троица IDS , а в розовой - LST. Опять же братственные I-L .В малиновой группе на третьей позиции (209) также довольно часто (относительно числа позиций , в которых нет S) встречается T (который чаще всего и встречается на этой же позиции в розовой группе). Пепельная группа схожа здесь лишь с малиновой группой. А именно тем , что в 207 колонке изолейцин .
У малиновой и желтой групп колонки 337-352 не пустые , у розовой и пепельной - пусто (за исключением 5 букв)
5. Сохраните таблицу со всеми белками из Uniprot с доменом семейства Pfam
Ссылка на таблицу с белками из Uniprot , у которых домен относится к семейству Mrr_cat_2 (PF13156) .Так как этот домен свойственен бактериям ,то я выбрал таксон PHYLUM.