Банк EMBL

На главную страницу третьего семестра

Идентификатор записи EMBL Тип молекулы
Класс данных
Раздел EMBL
Дата создания
Описание
Длина последовательности
U00096 circular genomic DNA STD PRO 23-FEB-2006 Escherichia coli K12 MG1655, complete genome. 4639675
AP009048 circular genomic DNA STD PRO 22-JAN-2006 Escherichia coli W3110 DNA, complete genome. 4646332
Итак, мы имеем две записи, содержащие последовательности генома кишечной палочки разных штаммов. Можно отметить большую длину второй последовательности, принципиальных же различий не наблюдается. Если отыскать в этих документах участки, кодирующие белок FCTA_ECOLI, то можно отметить, как видно из таблицы, их одинаковую длину при разных координатах (записи геномов имеют разную длину, как мы уже выяснили).
  I II
ID записи AP009048 U00096
Начало гена в записи 2497450 2490026
Конец гена в записи 2498700 2491276
Направление гена Обратное Обратное
Последовательности исследуемого гена (frc), извлеченные из этих геномов, совпадают на 100%.

Знакомство с записью гена из эукариотического генома

Исследован ген LTA. Схематично его запись можно изобразить следующим образом.

Комплементарная цепь

<--[369705..370745]--[370993..371098]--[371185..371292]--[371580..371710]---

Всего в гене имеется 4 экзона, самый длинный из них имеет длину 1040 нп, самый короткий - 105 нп. Самый длинный интрон имеет длину 288 нп, самый короткий - 87 нп.


©Петрова Ирина