Банк EMBL


1.Сравнение разных записей в EMBL

идентификатор записи EMBL тип молекулы класс данных раздел EMBL дата создания документа описание длина последовательности
AP009048 геномная ДНК STD PRO 22-JAN-2006 Escherichia coli W3110 DNA, complete genome. 4646332
U00096 геномная ДНК STD PRO 23-FEB-2006 Escherichia coli K12 MG1655, complete genome. 4639675
X53863 геномная ДНК STD PRO 28-JAN-1991 E. coli aspS gene for aspartyl-tRNA synthetase (EC 6.1.1.12) 3868
X53984 геномная ДНК STD PRO 02-JUN-1992 E.coli tls gene for aspartyl-tRNA synthetase (putative) 736
D10165 геномная ДНК STD PRO 16-JUL-1992 Escherichia coli gene for orf17, orf26, ruvC and orf23 genes 3255

Примечания: Вполне логично сравнивать данные записи по полю Описание (Description), т.к. это класс данных, раздел EMBL и тип молекулы одинаков для всех записей а дата создания и длина последовательности, напротив, различаются, но не имеют почти принципиального смысла. Первые 2 записи, самые новые, охватывают весь геном, длина последовательностей в них различается буквально совсем немного, это можно объяснить тем, что это геномы разных штаммов. Запись Х53863 описывает именно тот ген, который кодирует мой белок.

2.Сравнение описаний гена Escherichia coli в двух разных записях EMBL


Последовательности,кодирующие белок SYD_ECOLI в двух записях банка EMBL
... I II
ID записи X53863 u00096
Начало гена в записи 1372 1946774
Конец гена в записи 3144 1948546
Направление гена прямое обратное

При выполнении задания я сначала с помощью команды entret извлекла две записи EMBL, затем с помощью команды seqret из них вырезала нужные мне участки последовательности. Потом сравнила последовательности, воспользовавшись программой needle.
При сравнении двух записей EMBL было обнаружено 100% сходство. Не было замечено никаких замен и никакой вырожденности.

3.Знакомство с записью гена HBQ1 из эукариотического генома

идентификатор записи EMBL тип молекулы класс данных раздел EMBL длина последовательности дата создания документа описание
AE006462 геномная ДНК STD HUM 258002 13-JUN-2001 Homo sapiens 16p13.3 sequence section 1 of 8.
Ген на прямой цепи:
--[170486..170580]--...--[170979..171107]--->
  • Общее число экзонов в гене - 3
  • Длина самого длинного интрона - 109, самого короткого - 84
  • Длина самого длинного экзона - 246, самого короткого - 199
    Все расчеты приведены в файле Object.xls
    На главную
    На страницу третьего семестра
    ©Вахрушева Анна Алексеевна