Учебный сайт Алены Корягиной

Описание гена с идентификатором белка YP_001664069.1 из генома бактерии Thermoanaerobacter pseudethanolicus, штамм ATCC 33223

Продуктом гена с идентификатором белка YP_001664069.1 в базе данных NCBI Protein является белок, сходный с белком VirB4 и являющийся компонентом секреторной системы IV типа (англ. «Type IV secretory pathway VirB4 components-like protein»). В таблице 1 представлены основные свойства данного гена.

Таблица 1. Основные свойства гена с идентификатором белка YP_001664069.1 из генома Thermoanaerobacter pseudethanolicus ATCC 33223

Вид информации Квалификатор в записи генома Значение
Локус гена в геноме /gene отсутствует
Идентификатор гена в базе данных NCBI Gene /db_xref=”GeneID:…” 5 874 340
Начало гена в геноме 56 033
Конец гена в геноме 57 817
На какой цепи кодируется ген прямая
Длина гена (в парах нуклеотидов) 1 785
Идентификатор белка в базе данных NCBI Protein /protein_id YP_001664069.1
Длина белка (в аминокислотных остатках) 594

Интересно, что на прямой цепи, помимо данного гена, находятся подряд еще 60 генов. Чтобы сделать предположение о том, входит ли этот ген в какой-то оперон, рассмотрим межгенные расстояния близлежащих генов (рис.1).

Рис.1. Окружение гена с идентификатором белка YP_001664069.1 (отмечен черной рамкой) из генома Thermoanaerobacter pseudethanolicus ATCC 33223. Область, изображенная на рисунке — от 54 300 до 66 300 нуклеотида. Рисунок получен с помощью геномного браузера на сайте NCBI

Для удобства анализа составим таблицу 2, в которую запишем локус гена и расстояние в парах нуклеотидов от этого гена до следующего.

Таблица 2. Расстояния между близлежащими генами относительно гена с идентификатором белка YP_001664069.1

Локуc гена Межгенное расстояние до следующего гена (в парах нуклеотидов)
Teth39_0058 272
Teth39_0059 14
Teth39_0060 -1*
Teth39_0061 14
Teth39_0062 15
Teth39_0063 5
Teth39_0064 -30*
Teth39_0065 1
Teth39_0066 -1*
Teth39_0067 33
Teth39_0068 100
Teth39_0069 -2*
Teth39_0070 -1
Teth39_0071 663

«-n»* — ген перекрываются со следующим n-парами нуклеотидов

Жирным шрифтом выделен рассматриваемый ген с идентификатором белка YP_001664069.1.

Проанализировав межгенные расстояния между геном с идентификатором белка YP_001664069.1 и его ближайшими соседями, можно предположить, что в оперон входит 13 генов, начиная с гена, расположенного в локусе Teth39_0059, и заканчивая геном, расположенным в локусе Teth39_0071.

Теперь обратим внимание на описание некоторых белков, кодируемых генами из предположенного оперона. Продуктами генов, расположенных в локусе Teth39_0065 и Teth39_0066, являются белки секреторной системы II типа (англ. «type II secretion system protein»). Также вспомним, что продуктом рассматриваемого гена является белок секреторной системы IV типа. Таким образом, можно предположить, что данный оперон участвует в работе секреции бактерии T. pseudethanolicus.

© Alyona Koryagina aakor@fbb.msu.ru

Дата последнего изменения: 27.12.2013