На главную страницу сайта
На главную страницу третьего семестра
 

Работа с банком EMBL

Сравнение разных записей, касающихся BTUB_ECOLI, в EMBL

Из базы данных SwissProt был получен документ, описывающий белок BTUB_ECOLI:

entret sw:P06129 -auto

В системе поиска SRS были найдены все записи EMBL, содержащие информацию о BTUB_ECOLI. Результаты занесены в таблицу:

Идентификатор записи EMBL Тип молекулы
Класс данных
Раздел EMBL
Дата создания
документа
Описание
Длина последовательности
AP009048 Геномная ДНК STD PRO 22.01.2006    Полный геном штамма W3110 E.coli. 4646332
L14556 Геномная ДНК STD PRO 21.04.1993    Полная последовательность гена муреина, необходимого для синтеза D-глутамата, и 3'-конец гена btuB. 1742
M10112 Геномная ДНК STD PRO 18.11.1986    Ген btuB белка-рецептора витамина B12 BtuB. 2220
M57568 Геномная ДНК STD PRO 12.02.1991    Частичная последовательность гена белка, связывающего витамин B12 (BtuB), и полная последовательность m-5-U54 тРНК метилтрансферазы (trmA). 1684
U00006 Геномная ДНК STD PRO 22.09.1993    Участок хромосомы E.coli с 89.2 до 92.8 минуты. 176195
U00096 Геномная ДНК STD PRO 23.02.2006    Полная последовательность генома штамма K12 MG1655 E.coli. 4639675

Из шести найденных записей только одна соответствует гену BTUB_ECOLI (AC:M10112), две представляют собой полные геномы (AC:AP009048, U00096), ещё две содержат ген btuB, но не полностью (AC:L14556, M57568), а также участок хромосомы (AC:U00006). Поскольку записи с полными геномами брать не рекомендовалось, для сравнения были выбраны записи M10112 и U00006.

Сравнение описаний гена, кодирующего белок Outer membrane cobalamin translocator в Escherichia coli, в двух разных записях EMBL

Документы с записями получены с помощью программы entret:

entret sw:M10112 -auto
entret sw:U00006 -auto

  I II
ID ECBTUB ECUW89
Начало гена в записи 312 28881
Конец гена в записи 2156 30725
Направление гена прямое прямое
Примечания Под номером 298-304 предположительно
располагается Shine-Dalgarnao
последовательность.
Замена 394 тимина на цитозин приводит
к мутантному белку btuB451, у которого нарушена функция присоединения витамина B-12.
 

Нужные участки последовательностей получены с помощью seqret c параметром -sask
Выравниваниe построено с помощью программы needle с параметрами по умолчанию
Процент идентичности 99,8%

Таблица замен:
Замена 1 Замена 2 Замена 3 Замена 4
Позиция 18 485 1127 1131
Нуклеотид в ECBTUB C G C
Нуклеотид в ECUW89 G C C
Позиция в кодоне 3 2 2 3
Синонимичность Да Нет Да Нет

В первом случае мы видим простую синонимичную замену. Во втором — нуклеотидная замена G → C приводит к аминокислотной G → A. Указание на эту замену можно найти в документе из банка SwissProt (поле FT, строчка CONFLICT). Третья и четвертая замены — результат тройной замены, расцененной программой needle иначе:
Участок выравнивания Предполагаемая реальная ситуация
g c c a g - a
|     |  |  |     |
g - c c g c a
g c c a g a
|  |  .  .  .  |
g c a g c a

Учитывая подобное предположение, таблица замен будет выглядеть следующим образом:

Замена 1 Замена 2 Замена 3 Замена 4 Замена 5
Позиция 18 485 1128 1129 1130
Нуклеотид в ECBTUB C G C A G
Нуклеотид в ECUW89 G C A G C
Позиция в кодоне 3 2 3 1 2
Синонимичность Да Нет Да Нет Нет

Несинонимичные замены (4 и 5) приводят к замене A → R. Этот факт также указан в SwissProt.

Знакомство с записью гена из эукариотического генома

Для описания был дан ген, продукт которого называется "PCOLCE". Информация о нем была найдена в записи AF053356 EMBL генома человека.
Схема структуры транслируемых участков:

<-[167529..167695]--...--[173080..173174]----
Стоит заметить, что в записи CDS ген начинается с 167529 нуклеотида, а в поле mRNA с 167460.
Помимо этого указаны 9 участков с повторами. Ожидаемо, что все они находятся в некодирующих участках, по-видимому при сплайсинге вспомогательные белки узнают такие специфические повторы и, присоединяясь к ним, вырезают интроны. Также в записи указаны пять особенностей, которые далеки от моего понимания, могу лишь предположить что речь идет о большом количестве нуклеотидов G и C по сравнению с А и Т в указанных участках.

  • Число экзонов в гене - 9.
  • Самый длинный интрон - 878, самый короткий - 113.
  • Самый длинный экзон - 259, самый короткий - 72.
 

 

 

 


© Донченко Иван, 2007