Геномное окружение, занятие 7

Задание 1

Рассматриваемый ген имеет идентификатор LA_2373. Поиск по NCBI показывает, что это ген gspF (type II secretory pathway component protein F) организма Leptospira interrogans serovar Lai str. 56601 (Таксономия: Bacteria; Spirochaetes; Leptospirales; Leptospiraceae; Leptospira). В сервисе SEED выбираем организм в разделе "If You Need to Pick a Genome for Options Below" и в разделе "Searching for Genes or Functional Roles Using Text" в поле "Search Pattern" вводим выданный идентификатор гена. В выдаче один результат, переходим по нему на страницу гена. Кнопка "Advanced" раздела "Compare Regions For fig|189518.1.peg.2373" позволяет задать Region size 20000, Number of regions 40 и Evalue cutoff for coloring CDS sets 1e-10. На этих параметрах можем сделать вывод о частоте встречаемости каждого окружения. На картинке приведены наиболее характерные соседи.

При перерисовке после убирания галочек SEED меняет настройки, к примеру, радиус окружения, поэтому изображения участков ДНК были вынесены отдельно. Все гены окружения, встречающиеся меньше, чем в 4 экземплярах, были сочтены нехарактерными. Гены 8, 11, 12, 13, 15 встречаются часто, но идут вразнобой, никак не коррелируя с остальными, поэтому не учтены. Наиболее консервативным окружением являются гены 2, 3, 4, 5, 6, 7. Однако рассматриваемый ген может встретиться вообще без этих соседей (5 случаев), а, значит, способен работать по отдельности.

Задание 2


На сайте DOOR был найден оперон 69972, куда входит рассматриваемый ген и его соседи, найденные в SEED: gspC, gspE, gspG, gspD.

Информация об опероне:


Задание 3


В базе KEGG был найден транспортёр, формируемый рассматриваемым белком и его окружением:

Гены gspE, gspC, gspG и gspD из оперона 69972 входят в состав комплекса в качестве структурных единиц.
Идентификатор LA_2373
Имя gspF (type II secretory pathway component protein F)
Организм Leptospira interrogans serovar Lai str. 56601
Функция белка Субъединица мембранного транспортёра
Система KEGG Bacterial secretion system
Номер оперона 69972
Белки, кодируемые в опероне gspC, gspD, gspE, gspF, gspG, M23 family metalloendopeptidase, hypothetical protein
Белки, найденные в окружении gspC, gspD, gspE, gspF, gspG