назад

Дата последнего проиндексированного релиза EMBL: 7 сентября 2009 года, количество записей 108577013.

Классы данных EMBL
название и описакние число записей, проиндексированных SRS для последнего релиза
ANN: Constructed sequence with annotation записи непроиндексированы
CON: Constructed sequence записи непроиндексированы
EST: Expressed Sequence Tag 62846990
GRV: Genome Reviews записи непроиндексированы
GSS: Genome Survey Sequence 25905073
HTC: High Throughput cDNA sequencing 549753
HTG: High Throughput Genome sequencing 142473
MGA: Mass Genome Annotation записи непроиндексированы
PAT: Patent 10439165
SET: Project set (EMBL WGS Masters only) записи непроиндексированы
STD: Standard 7253026
STS: Sequence Tagged Site 1310171
TPA: Third Party Annotation 6520
TSA: Transcriptome Shotgun Assembly 123842
WGS: Whole Genome Shotgun записи непроиндексированы

Разделы EMBL
название и описание число записей в последнем релизе
ENV: образцы из окружающей среды (метагеном) 4145029
FUN: грибы 3942084
HUM: человек 12841544
INV: беспозвоночные 15518735
MAM: другие млекопитающие 9429823
MUS: мышь 7424621
PHG: бактериофаги 5865
PLN: растения 33806044
PRO: покариоты 909986
ROD: грызуны 2261678
SYN: синтетические 2671622
TGN: трансгенные 265465
UNC: неклассифицированные 3945859
VRL: вирусы 827405
VRT: другие позвоночные 10581253

Динамика появлений стандартных записей (класса STD) за март 2008 и март 2009:
  март 2008 март 2009
ENV 716180 1029880
HUM 489445 540196
TGN 825 849

За год поступление данных о человеке и метагеноме увеличилось, причем записей о метагеноме стало значительно больше. Поступление данных в радел трансгенных организмов также ускорилось, но на общем фоне их количество небольшое.

Описание гена NFKBIL1 в записи EMBL с кодом доступа BA000025:

  направление гена: обратное
  число кодирующих участков: 4
  длины первого кодирующего участка: 57
  длина последнего кодирующего участка: 590
  длина первого интрона: 411
  длина последнего интрона: 171
  

Поиск BLASTX в Swiss-Prot белка по самому длинному кодирующему участку:

Самый длинный кодирующий участок соответсвует 1-му (590 азотистых омнований) (385413..386002)

С помощью программы seqret получен файл dna.fasta с этой последовательностью. Программа BLASTX нашла много белков, лучшая находка (E-value=1e-85) белок Q9UBC1 , экзон соответсвует участку белка с 187 по 381 а.о.

Информация о записях EMBL, на которые ссылается запись Swiss-Prot о белке p33221:

С помощью команды entret sw:p33221 p33221.sw получен файл p33221.sw с записью о белке p33221 в Swiss-Prot, с помощью SRS получена информация о 3 записях EMBL:

Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
документа
Описание Длина последовательности
AP009048 геномная ДНК STD PRO 22-JAN-2006 Escherichia coli str. K12 substr. W3110 DNA, complete genome 4646332
L20897 геномная ДНК STD PRO 14-JUL-1993 Escherichia coli ген глицинамидрибонуклеотидтрансформилазы (PURT), ген 2-кето-3-дезокси-6-фосфоглюконатальдолазы (eda), ген 6-фосфоглюконатдегидротазы (edd), complete cds's 4649
U00096 геномная ДНК STD PRO 23-FEB-2006 Escherichia coli str. K-12 substr. MG1655, complete genome. 4639675

Файл с результатом запроса.