Занятие 11
Reaction
RCH2NH2 + H2O + O2 <==> RCHO + NH3 + H2O2
1.4.3.6 - oxidoreductase
Филогенетическое дерево
N3 и N2 НЕ встречаются сами по себе и всегда в архитектуре у них присутствует либо (много чаще) Cu_amine_oxid, либо N1
Домен Cu_amine_oxid встречается у бактерий и эукариот как
самостоятельно, так и вместе с другими доменами.
Причем, и среди бактерий, и среди эукариот присутствуют обладатели архитектур
N2+N3+Cu_amine_oxid,
N3+Cu_amine_oxid и
N2+Cu_amine_oxid
Не рассматриваемый мною домен Cu_amine_oxidN1 оказался присущ ТОЛЬКО бактериям, к тому же, в трети случаев
он существует один; в остальных случаях он связан с совершенно другими доменами, и
только в 76 из 1707 последовательностях архитектура имеет вид N1+N2+N3+Cu_amine_oxid :
Вероятность повторного возникновения сразу 4 доменов крайне низка. Значит, строить гипотезу нужно основываясь на этих данных,
принимая эту архитектуру как отправную точку.
Из четырехдоменной архитектуры возникла трехдоменная, полностью лишенная N1 и выполняющая ту же функцию:
Эту архитектуру имеет половина всех последовательностей. Анализ затруднен тем, что у одного организма может присутствовать по несколько архитектур.
Судя по всему, архитектуры N2+Cu_amine_oxid и N3+Cu_amine_oxid
__
возникли путем потери одного из доменов данной архитектуры. Объяснить утерю N2 проще, так как
это концевой домен. Он мог либо "растворится" под напором мутаций, либо исчезнуть с утерей экзона у эукариот.
Что касается N3, то он вряд ли исчез в результате утраты экзона. Дело в том, что расстояние между N2 и Cu_amine_oxid в двухдоменной архитектуре примерно равно размеру N3.
Более того, при изучении выравнивания я заметил, что область между N2 и Cu_amine_oxid все же имеет идентичность с N3. На основании этого я делаю вывод, что
N3 "растворился" в произошедших мутациях.
Возможная cхема эволюции архитектур:
Филогенетический анализ показал, что Cu_amine_oxid домен грибов отличается от домена других организмов.
Результат работы алгоритма N-J:
Fu - Грибы; Me - Животные; Ac - Актиномицеты; Vi - Зеленые растения; А - археи; В - бактерии; Е - эукариоты;
Таким образом, грибы отчетливо выделяются среди других организмов
Newick-формат
Деление
Мое деление основывается таксономии. Грибы я отделяю от остальных.
Профили
Я выбрал для построения профиля не все последовательности, ибо местами были регионы low_complexity, и во избежании помех
такие последовательности я отсек.
Выполнил последовательность шагов в указаниях
Построил профиль для группы грибов и для группы остальных организмов. На удивление, профили оказались избирательными:
Значение -С можно выбирать в широком интервале без потери качества поиска; зеленым - интервал выбора.
Я остановился на значениях: 115.0 для грибов и 70.0 для остальных.
профиль грибов
профиль других
excel-документ
Поиск по БД
Созданными профилями осуществил поиск по SwissProt. Не понятно почему поиск по целой ДБ выдает меньше находок чем поиск по выборке.
(я поискал в /home/export/samba/public/y10/Term_4/Block_3/task11/swissprot.fasta некоторые белки и не нашел... может быть файл не полный или есть разногласия в названиях)
Странно, но при значении -С115.0 для грибов был найден лиш 1 белок грибной белок (score 138.06) (Он есть в выборке; архитектура N3+Cu_amine_oxid ).
Если понизить -С до 70.0 (то есть очень сильно), то будет 7 различных находок (5 из них грибы, остальные бактерии)
Для других организмов при -С70.0 нашлось 8 белков. Они принадлежат бактериям, растениям и человеку (в выборке их нет, но они аминооксидазы тоже;
доменные архитектуры из N2, N3 и Cu_amine_oxid).
При понижении -С до 50.0 (сильно) находок становится 16, и среди них всего 4 гриба.
То есть, я получил профили, неплохо отличающие аминооксидазы грибов от аминооксидаз других организмов.
*это вряд ли относится к делу, но мне было интересно. Оказалось что у Aspergillus clavatus штамм ATCC 1007 присутствуют сразу 4 архитектуры: