Для работы был выбран домен PF06857.
Это семейство состоит из нескольких бактериальных белков дельта-субъединицы малонатдекарбоксилазы (MdcD). Малонатдекарбоксилаза Klebsiella pneumoniae состоит из четырех различных субъединиц и катализирует превращение малоната плюс H+ в ацетат и CO2. Катализ протекает через остатки ацетила и малонилтиоэфира с фосфрибозил-дефосфо-КоА протезной группы субъединицы ацильного белка-носителя (ACP). MdcC - это (apo) ACP субъединица [1]. Семейство также содержит семейство цитратлиазных ацил-переносчиков CitD.
Seed включает в себя 117 последовательномтей. Я скачала выравнивание seed, перевела его в формат Jalview и нашла мотив D.GA.{7}R консервативный 113/117 последоватлеьностям с Above identity threshold выстановленым на 83%, следовательно у этого мотива очень высокая представленность (IC).
Далеея перевла найденный мотив в формат PROSITE: D-x-G-A-x(7)-R
Поиск мотива осуществлялся на сайте ProSite по базе данных SwissProt. Программа выдала мне 3709 находок.
Дерево было построено в Jalview по алгоритму NJ. В построенном дереве четко выделялась зеленая клада из 31 белка. Исходя из этой клады я нашла новый мотив GVV.SG.{2}E, который консервативен 25 из 31 последовательностям. И, что бы определеить спецефичность данного мотива для этой клады, я выполнела поиск данного мотива во всех последовательность. Итог, данный мотив не был обнаружен нигде, кроме выбранной мной клады.
Для работы с PSI-BLAST я выбрала AC: P47908. Это фактор гибернации рибосом, он необходим для димеризации активных 70S рибосом в 100S рибосомы в стационарной фазе, а так же может модулировать как транскрипцию, так и трансляцию.
Номер итерации | Число находок выше порога | Идентификатор худшей находки выше порога | E-value этой находки | Идентификатор лучшей находки ниже порога | E-value этой находки |
---|---|---|---|---|---|
1 | 24 | P30334.1 | 0.004 | - | - |
2 | 28 | P9WMA8.1 | 3e-6 | - | - |
3 | 28 | P24694.1 | 4e-21 | - | - |
4 | 28 | P24694.1 | 3e-21 | - | - |
5 | 28 | P24694.1 | 3e-21 | - | - |
6 | 28 | P24694.1 | 3e-21 | - | - |
Мной была выбрана доменная архитектура ACP PF06857. Это семейство состоит из нескольких бактериальных белков дельта-субъединицы малонатдекарбоксилазы (MdcD). Малонатдекарбоксилаза Klebsiella pneumoniae состоит из четырех различных субъединиц и катализирует превращение малоната плюс H+ в ацетат и CO2. Катализ протекает через остатки ацетила и малонилтиоэфира с фосфрибозил-дефосфо-КоА протезной группы субъединицы ацильного белка-носителя (ACP). MdcC - это (apo) ACP субъединица [1]. Семейство также содержит семейство цитратлиазных ацил-переносчиков CitD.
Из 6333 белков было выбранно первые 50, и с ними был запущен MEME, а затем, используя результаты этой программы, был запущен FIMO при помощи следующих команд:
meme protein-sequences50.fasta -o meme_results -minw 4 -nmotifs 4
fimo ./meme_results/meme.txt protein-sequences50.fasta
Ссылка на аннотированную геномную сборку
С помощью скрипта, предоставленного Каримовой Кариной, были посчитаны контрасты obs/exp по методу Карлина для этого сайта GATC, а также для всех сайтов длины 4, полученных перестановками (без повторений) букв A, T, G, C.
Сайты GATC представлены в геноме в том же количестве, которое статистически ожидалось.