Банк EMBL

Идентификатор записи EMBL Тип молекулы
Класс данных
Раздел EMBL
Дата создания
документа
Описание
Длина последовательности
AP009048 genomic DNA STD PRO 22-JAN-2006 Escherichia coli W3110 DNA, complete genome. 4646332
U00096 genomic DNA STD PRO 22-JAN-2006 Escherichia coli K12 MG1655, complete genome. 4639675
D90745 genomic DNA STD PRO 22-JAN-2006 Replaced by AP009048 on 20-JAN-2006. 1
M84991 genomic DNA STD PRO 22-JAN-2006 Escherichia coli 3-ketoacyl-acyl carrier protein reductase (fabG) and acyl carrier protein (acpP) genes, complete cds, and malonyl CoA-acyl carrier protein transacylase (fabD) gene, 5' end. 1378
M87040 genomic DNA STD PRO 22-JAN-2006 Escherichia coli malonyl coenzyme A-acyl carrier protein (fabD) gene, complete cds. 1608

  I II
ID записи M84991 M87040
Начало гена в записи 79 1474
Конец гена в записи 813 1608
Направление гена Прямое Прямое
Примечания*   В этой записи преведен не полный мой белок, а только его часть.(Кодирующую последовательность обрезали на середине.)

В моем случае удобнее сделать локальное выравнивание(water), т.к в M87040 содержится только часть белка.
Последовательности совпали на 98.5%
Позиция от начала кодирующей последовательности 89 128
Нуклеотид в первом варианте(M84991) G A
Нуклеотид во втором варианте(M87040) C G
Позиция в кодоне 2 2

Открыл EMBL файл с ID ВА0000255 нашл там кодируемые участки гена 1C7. Увидел, что содержится 4 экзона. Между 4 экзонами должно лежать 3 интрона.

Ген на прямой цепи
--[351304..351346]--...--[354794..354831]--->
С помощью Excel посчитал: Длина самого длинного экзона - 344 Длина самого длинного интрона - 2553

На главную страницу семестра


©Goryanin Ignat 2005