Практиум 10

Консервативные мотивы в выравнивании.


Для работы был выбран домен PF06857.

Это семейство состоит из нескольких бактериальных белков дельта-субъединицы малонатдекарбоксилазы (MdcD). Малонатдекарбоксилаза Klebsiella pneumoniae состоит из четырех различных субъединиц и катализирует превращение малоната плюс H+ в ацетат и CO2. Катализ протекает через остатки ацетила и малонилтиоэфира с фосфрибозил-дефосфо-КоА протезной группы субъединицы ацильного белка-носителя (ACP). MdcC - это (apo) ACP субъединица [1]. Семейство также содержит семейство цитратлиазных ацил-переносчиков CitD.

Seed включает в себя 117 последовательномтей. Я скачала выравнивание seed, перевела его в формат Jalview и нашла мотив D.GA.{7}R консервативный 113/117 последоватлеьностям с Above identity threshold выстановленым на 83%, следовательно у этого мотива очень высокая представленность (IC).

Далеея перевла найденный мотив в формат PROSITE: D-x-G-A-x(7)-R

Поиск мотива осуществлялся на сайте ProSite по базе данных SwissProt. Программа выдала мне 3709 находок.


Поиск мотива, специфичного для одной клады филогенетического дерева.

Дерево было построено в Jalview по алгоритму NJ. В построенном дереве четко выделялась зеленая клада из 31 белка. Исходя из этой клады я нашла новый мотив GVV.SG.{2}E, который консервативен 25 из 31 последовательностям. И, что бы определеить спецефичность данного мотива для этой клады, я выполнела поиск данного мотива во всех последовательность. Итог, данный мотив не был обнаружен нигде, кроме выбранной мной клады.

fig8
Рис. 1 Дерево последовательностей PF06857.
fig8
Рис. 2Зеленным цветом показана выбранная клада PF06857.

PSI-BLAST.


Для работы с PSI-BLAST я выбрала AC: P47908. Это фактор гибернации рибосом, он необходим для димеризации активных 70S рибосом в 100S рибосомы в стационарной фазе, а так же может модулировать как транскрипцию, так и трансляцию.

Таблица 1. Результаты итераций PSI-BLAST, порог 0.005
Номер итерации Число находок выше порога Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 24 P30334.1 0.004 - -
2 28 P9WMA8.1 3e-6 - -
3 28 P24694.1 4e-21 - -
4 28 P24694.1 3e-21 - -
5 28 P24694.1 3e-21 - -
6 28 P24694.1 3e-21 - -

Поиск мотивов de novo в выборке поледовательностей с доменом из SwissProt.

Мной была выбрана доменная архитектура ACP PF06857. Это семейство состоит из нескольких бактериальных белков дельта-субъединицы малонатдекарбоксилазы (MdcD). Малонатдекарбоксилаза Klebsiella pneumoniae состоит из четырех различных субъединиц и катализирует превращение малоната плюс H+ в ацетат и CO2. Катализ протекает через остатки ацетила и малонилтиоэфира с фосфрибозил-дефосфо-КоА протезной группы субъединицы ацильного белка-носителя (ACP). MdcC - это (apo) ACP субъединица [1]. Семейство также содержит семейство цитратлиазных ацил-переносчиков CitD.

fig8
Рис. 3 Выбранная доменная архитектура ACP.

Из 6333 белков было выбранно первые 50, и с ними был запущен MEME, а затем, используя результаты этой программы, был запущен FIMO при помощи следующих команд:

meme protein-sequences50.fasta -o meme_results -minw 4 -nmotifs 4

fimo ./meme_results/meme.txt protein-sequences50.fasta

Выдача MEME и FIMO.


Оценка представленности сайта GATC в геноме Salmonella enterica subsp. enterica serovar Typhimurium str. LT2.


Ссылка на аннотированную геномную сборку

С помощью скрипта, предоставленного Каримовой Кариной, были посчитаны контрасты obs/exp по методу Карлина для этого сайта GATC, а также для всех сайтов длины 4, полученных перестановками (без повторений) букв A, T, G, C.

fig8
Рис. 4 Гистограмма представленности для всех сайтов длины 4, полученных перестановками (без повторений) букв A, T, G, C.

Сайты GATC представлены в геноме в том же количестве, которое статистически ожидалось.