Практикум 8

Задание 1

Sirtuins - древнее консервативное семейство НАД-зависимых белков, ответственных за реугляцию метаболизма. Представляют из себя деацетилазы гистонов (и не только) и моно-ADP-рибозилтрансферазы, локализованные как в ядре, так и в цитоплазме. Участвуют во многих важнейших клеточных процессах таких, как старение, транскрипция, апоптоз, воспаление и др.. Важными представителями являются: SIRT6 (ассоциирован со старением, связывается с NF-kB и деацетилирует H3K9), SIRT5 (деацетилирует цитохром c), SIRT1 (деацетилируя p53, ингибирует апоптоз) и др..

Структура дрожжевого sir2
Ccылка

Один из найденных паттернов - 'TQN.D.L', в seed выравнивании, скачанном с PFAM, его содержат все 18 посл-тей. Судя по аминокислотному составу может нести каталитическую функцию (треонин-глутамин-аспаргин-гидрофобная а.к.- аспартат-любая а.к.-лейцин)

Искал по описанному выше паттерну на предложенном веб-сервисе по Swiss-Prot, получил 198 находок и расстроился. Попробовал немного его укоротить до 'TQN.D', в результате получил 888 находок, некоторые из них даже принадлежат выбранному семейству. Получается, новый паттерн значимее?).

Задание 2

Построил следующее дерево, выбрал кладу с белками, отмеченными серым цветом:

Посмотрел на выравние белков из этой клады, и обнаружил, что паттерн, выбранный выше, можно расширить до 'TQNID.LE'. Посмотрел на наличие этого паттерна в изначальном выравнивании, и оказалось, что он есть только в составе белков клады. Значит, есть вероятность того, что есть некая генеральная клада белков, для которой важно наличие именно этого мотива. Правда, поиск по Swiss-Prot оказался неудачным: 32 находки, не думаю, что это можно считать чем-то существенным.

Задание 3

Для выполнения выбрал P0AD49- белок, предотвращающий образование рибосомы (70S димера) во время стационарной фазы роста Escherichia coli, этим и регулирует трансляцию.

Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 22 Q49VV1.1 8e-04 PSRP1 3e-30
2 27 O05886.4 9e-10 - -

Поиск сошелся, семейство найденных довольно неплохое, т.к. e-value худшей из лучших находок довольно мал.

Задание 4

Bacillus subtilis subsp. subtilis str. 168, ожидаемое = 218025 , наблюдаемое = 336259, ratio exp/obs = 0.648, p-value крайне мал, буквально 0 (хитрый chi-square), распределение димеров ДНК явно устроено сложнее, чем то, что было использовано при вычислении ожидаемого кол-ва TA


Supplementary materials

Выравнивание белков из seed PF02146(семейство сиртуинов)
Выбранная из них группа белков