|
Работа с банком EMBL
Сравнение разных записей, касающихся BTUB_ECOLI, в EMBL
Из базы данных SwissProt был получен документ, описывающий белок BTUB_ECOLI:
entret sw:P06129 -auto
В системе поиска SRS были найдены все записи EMBL, содержащие информацию о BTUB_ECOLI. Результаты занесены в таблицу:
Идентификатор записи EMBL |
Тип молекулы |
Класс данных
|
Раздел EMBL
|
Дата создания
документа |
Описание
|
Длина последовательности
|
AP009048
|
Геномная ДНК
|
STD
|
PRO
|
22.01.2006
|
   Полный геном штамма W3110 E.coli.
|
4646332
|
L14556
|
Геномная ДНК
|
STD
|
PRO
|
21.04.1993
|
   Полная последовательность гена муреина, необходимого для синтеза D-глутамата, и 3'-конец гена btuB.
|
1742
|
M10112
|
Геномная ДНК
|
STD
|
PRO
|
18.11.1986
|
   Ген btuB белка-рецептора витамина B12 BtuB.
|
2220
|
M57568
|
Геномная ДНК
|
STD
|
PRO
|
12.02.1991
|
   Частичная последовательность гена белка, связывающего витамин B12 (BtuB), и полная последовательность
m-5-U54 тРНК метилтрансферазы (trmA).
|
1684
|
U00006
|
Геномная ДНК
|
STD
|
PRO
|
22.09.1993
|
   Участок хромосомы E.coli с 89.2 до 92.8 минуты.
|
176195
|
U00096
|
Геномная ДНК
|
STD
|
PRO
|
23.02.2006
|
   Полная последовательность генома штамма K12 MG1655 E.coli.
|
4639675
|
Из шести найденных записей только одна соответствует гену BTUB_ECOLI (AC:M10112), две представляют собой полные геномы
(AC:AP009048, U00096), ещё две содержат ген btuB, но не полностью (AC:L14556, M57568), а также участок хромосомы (AC:U00006).
Поскольку записи с полными геномами брать не рекомендовалось, для сравнения были выбраны записи M10112 и U00006.
Сравнение описаний гена, кодирующего белок Outer membrane cobalamin translocator в Escherichia coli, в двух разных записях EMBL
Документы с записями получены с помощью программы entret:
entret sw:M10112 -auto
entret sw:U00006 -auto
  |
I |
II |
ID |
ECBTUB |
ECUW89 |
Начало гена в записи |
312 |
28881 |
Конец гена в записи |
2156 |
30725 |
Направление гена |
прямое |
прямое |
Примечания |
Под номером 298-304 предположительно располагается Shine-Dalgarnao последовательность.
Замена 394 тимина на цитозин приводит к мутантному белку btuB451, у которого нарушена функция присоединения витамина B-12.
|
  |
Нужные участки последовательностей получены с помощью seqret c параметром -sask
Выравниваниe построено с помощью программы needle с параметрами по умолчанию
Процент идентичности 99,8%
Таблица замен:
|
Замена 1 |
Замена 2 |
Замена 3 |
Замена 4 |
Позиция |
18 |
485 |
1127 |
1131 |
Нуклеотид в ECBTUB |
C |
G |
C |
— |
Нуклеотид в ECUW89 |
G |
C |
— |
C |
Позиция в кодоне |
3 |
2 |
2 |
3 |
Синонимичность |
Да |
Нет |
Да |
Нет |
В первом случае мы видим простую синонимичную замену. Во втором — нуклеотидная замена G → C приводит к аминокислотной
G → A. Указание на эту замену можно найти в документе из банка SwissProt (поле FT, строчка CONFLICT). Третья и четвертая замены — результат тройной замены, расцененной программой needle иначе:
Участок выравнивания |
Предполагаемая реальная ситуация |
g c c a g - a
| | | | |
g - c c g c a
|
g c c a g a
| | . . . |
g c a g c a
|
Учитывая подобное предположение, таблица замен будет выглядеть следующим образом:
|
Замена 1 |
Замена 2 |
Замена 3 |
Замена 4 |
Замена 5 |
Позиция |
18 |
485 |
1128 |
1129 |
1130 |
Нуклеотид в ECBTUB |
C |
G |
C |
A |
G |
Нуклеотид в ECUW89 |
G |
C |
A |
G |
C |
Позиция в кодоне |
3 |
2 |
3 |
1 |
2 |
Синонимичность |
Да |
Нет |
Да |
Нет |
Нет |
Несинонимичные замены (4 и 5) приводят к замене A → R. Этот факт также указан в SwissProt.
Знакомство с записью гена из эукариотического генома
Для описания был дан ген, продукт которого называется "PCOLCE". Информация о нем была найдена в записи AF053356 EMBL генома человека.
Схема структуры транслируемых участков:
<-[167529..167695]--...--[173080..173174]----
Стоит заметить, что в записи CDS ген начинается с 167529 нуклеотида, а в поле mRNA с 167460. Помимо этого указаны 9 участков с повторами. Ожидаемо, что все они находятся в некодирующих участках, по-видимому при сплайсинге вспомогательные белки узнают такие специфические повторы и, присоединяясь к ним, вырезают интроны. Также в записи указаны пять особенностей, которые далеки от моего понимания, могу лишь предположить что речь идет о большом количестве нуклеотидов G и C по сравнению с А и Т в указанных участках.
- Число экзонов в гене - 9.
- Самый длинный интрон - 878, самый короткий - 113.
- Самый длинный экзон - 259, самый короткий - 72.
|
|