Геномное окружение, занятие 7Задание 1Рассматриваемый ген имеет идентификатор LA_2373. Поиск по NCBI показывает, что это ген gspF (type II secretory pathway component protein F) организма Leptospira interrogans serovar Lai str. 56601 (Таксономия: Bacteria; Spirochaetes; Leptospirales; Leptospiraceae; Leptospira). В сервисе SEED выбираем организм в разделе "If You Need to Pick a Genome for Options Below" и в разделе "Searching for Genes or Functional Roles Using Text" в поле "Search Pattern" вводим выданный идентификатор гена. В выдаче один результат, переходим по нему на страницу гена. Кнопка "Advanced" раздела "Compare Regions For fig|189518.1.peg.2373" позволяет задать Region size 20000, Number of regions 40 и Evalue cutoff for coloring CDS sets 1e-10. На этих параметрах можем сделать вывод о частоте встречаемости каждого окружения. На картинке приведены наиболее характерные соседи.При перерисовке после убирания галочек SEED меняет настройки, к примеру, радиус окружения, поэтому изображения участков ДНК были вынесены отдельно. Все гены окружения, встречающиеся меньше, чем в 4 экземплярах, были сочтены нехарактерными. Гены 8, 11, 12, 13, 15 встречаются часто, но идут вразнобой, никак не коррелируя с остальными, поэтому не учтены. Наиболее консервативным окружением являются гены 2, 3, 4, 5, 6, 7. Однако рассматриваемый ген может встретиться вообще без этих соседей (5 случаев), а, значит, способен работать по отдельности. Задание 2На сайте DOOR был найден оперон 69972, куда входит рассматриваемый ген и его соседи, найденные в SEED: gspC, gspE, gspG, gspD. Информация об опероне: Задание 3В базе KEGG был найден транспортёр, формируемый рассматриваемым белком и его окружением: Гены gspE, gspC, gspG и gspD из оперона 69972 входят в состав комплекса в качестве структурных единиц.
|