На главную страницу
На главную страницу третьего семестра
C помощью SRS найдена информация о записях в банке EMBL.
| Идентификатор записи EMBL | Тип молекулы |
Класс данных |
Раздел EMBL |
Дата создания документа |
Описание |
Длина последовательности |
| U00096 | genomic DNA | STD | PRO | 23-FEB-2006 | Escherichia coli K12 MG1655, complete genome (полный геном Escherichia coli K12 MG1655) | 4639675 |
| U18997 | genomic DNA | STD | PRO | 30-DEC-1994 | Escherichia coli K-12 chromosomal region from 67.4 to 76.0 minutes (участок хромосомы с 67.4' по 76.0') | 372438 |
| Y00710 | genomic DNA | STD | PRO | 12-MAR-1990 | Escherichia coli aroE gene for shikimate dehydrogenase (EC 1.1.1.25) (ген шикимат дегидрогеназы) | 819 |
Первые две записи описывают крупный кусок генома (первая весь геном), соответственно
длина последовательности велика. Третья запись ген белка AROE_ECOLI, его длина
в 3 раза больше чем длина белковой последовательности + 1 (впоследствии удаляющийся метионин).
Заметим, что сначала аннотирован ген белка, затем фрагмент генома и совсем недавно полный
геном.
Все записи относятся разделу "ПРОКАРИОТЫ"
Обозначение «67.4' по 76.0'» означает положение участка в кольцевой
хромосоме, но единицы не совпадают с геометрическими минутами (1/60 градуса).
Это время от начала конъюгации, на котором передается данный фрагмент.
| I | II | |
| ID записи | Y00710 | U18997 |
| Начало гена в записи | 1 | 210766 |
| Конец гена в записи | 819 | 211584 |
| Направление гена | прямое | обратное |
| Примечания* | Не указан штамм Escherichia coli. ID белка "CAA68700.1" | ID белка "AAA58078.1" (не совпадают!) |
В файлах AROE_gene1.fasta и AROE_gene2.fasta
содержатся нуклеотидные последовательности, кодирующие белок AROE_ECOLI,
из этих записей.
Как показывает их выравнивание, построенное с помощью программы needle,
они абсолютно идентичны (Identity=100%).
5'---[291393..291628]--...--[304801..304986]--->3'