Практикум 8
Задание 1
Sirtuins - древнее консервативное семейство НАД-зависимых белков, ответственных за реугляцию метаболизма. Представляют из себя деацетилазы гистонов (и не только) и моно-ADP-рибозилтрансферазы, локализованные как в ядре, так и в цитоплазме. Участвуют во многих важнейших клеточных процессах таких, как старение, транскрипция, апоптоз, воспаление и др.. Важными представителями являются: SIRT6 (ассоциирован со старением, связывается с NF-kB и деацетилирует H3K9), SIRT5 (деацетилирует цитохром c), SIRT1 (деацетилируя p53, ингибирует апоптоз) и др..
Один из найденных паттернов - 'TQN.D.L', в seed выравнивании, скачанном с PFAM, его содержат все 18 посл-тей. Судя по аминокислотному составу может нести каталитическую функцию (треонин-глутамин-аспаргин-гидрофобная а.к.- аспартат-любая а.к.-лейцин)
Искал по описанному выше паттерну на предложенном веб-сервисе по Swiss-Prot, получил 198 находок и расстроился. Попробовал немного его укоротить до 'TQN.D', в результате получил 888 находок, некоторые из них даже принадлежат выбранному семейству. Получается, новый паттерн значимее?).
Задание 2
Построил следующее дерево, выбрал кладу с белками, отмеченными серым цветом:
Посмотрел на выравние белков из этой клады, и обнаружил, что паттерн, выбранный выше, можно расширить до 'TQNID.LE'. Посмотрел на наличие этого паттерна в изначальном выравнивании, и оказалось, что он есть только в составе белков клады. Значит, есть вероятность того, что есть некая генеральная клада белков, для которой важно наличие именно этого мотива. Правда, поиск по Swiss-Prot оказался неудачным: 32 находки, не думаю, что это можно считать чем-то существенным.
Задание 3
Для выполнения выбрал P0AD49- белок, предотвращающий образование рибосомы (70S димера) во время стационарной фазы роста Escherichia coli, этим и регулирует трансляцию.
Номер итерации | Число находок выше порога (0,005) | Идентификатор худшей находки выше порога | E-value этой находки | Идентификатор лучшей находки ниже порога | E-value этой находки |
---|---|---|---|---|---|
1 | 22 | Q49VV1.1 | 8e-04 | PSRP1 | 3e-30 |
2 | 27 | O05886.4 | 9e-10 | - | - |
Поиск сошелся, семейство найденных довольно неплохое, т.к. e-value худшей из лучших находок довольно мал.
Задание 4
Bacillus subtilis subsp. subtilis str. 168, ожидаемое = 218025 , наблюдаемое = 336259, ratio exp/obs = 0.648, p-value крайне мал, буквально 0 (хитрый chi-square), распределение димеров ДНК явно устроено сложнее, чем то, что было использовано при вычислении ожидаемого кол-ва TA
Supplementary materials
Выравнивание белков из seed PF02146(семейство сиртуинов)
Выбранная из них группа белков