Банк нуклеотидных последовательностей EMBL


Последний проиндексированный в системе SRS релиз EMBL

Последний релиз EMBL был проиндексирован 07 сентября 2009 и содержит 108577013 записей. Список классов ("Data Class") банка EMBL (жирным курсивом выделены не проиндексированные классы):

Обозначение Описание Количество проиндексированных записей
ANN Constructed sequence with annotation Не проиндексированы
CON Constructed sequence Не проиндексированы
EST Expressed Sequence Tag 62846990
GRV Genome Reviews Не проиндексированы
GSS Genome Survey Sequence 25905073
HTC High Throughput cDNA sequencing 549753
HTG High Throughput Genome sequencing 142473
MGA Mass Genome Annotation Не проиндексированы
PAT Patent 10439165
SET Project set (EMBL WGS Masters only) Не проиндексированы
STD Standard 7253026
STS Sequence Tagged Site 1310171
TPA Third Party Annotation 6520
TSA Transcriptome Shotgun Assembly 123842
WGS Whole Genome Shotgun Не проиндексированы

Так же был получен список разделов банка и количество записей в них:

Обозначение Описание (откуда получены) Количество записей
ENV Окружающая среда 4145029
FUN Грибы 3942084
HUM Человек 12841544
INV Беспозвоночные 15518735
MAM Другие млекопитающие 9429823
MUS Мышь (Mus musculus) 7424621
PHG Бактериофаги 5865
PLN Растения 33806044
PRO Прокариоты 909986
ROD Грызуны 2261678
SYN Синтетические 2671622
TGN Трансгенетические 265465
UNC Не классифицированные 3945859
VRL Вирусы 827405
VRT Другие позвоночные 10581253

Ген MICE по записи EMBL с кодом доступа BA000025.

Согласно записи BA000025 число экзонов (кодирующих участков) гена MICE равно 6, длина первого из них равна 75, а последнего - 303 нуклеотида. Длина первого интрона - 3173, последнего - 2153 нуклеотида. Направление экзонов относительно выбранного для записи направления - прямое.

Самый длинный экзон гена MICE человека

Самым длинным является последний экзон гена (303 нуклеотида). Для того, чтобы найти белки, вероятно содержащие участок, закодированный в экзоне, действовал следующим образом:
открыл страницу http://blast.ncbi.nlm.nih.gov/;
помощью пояснений напротив названия программ выбрал blastx (на вход подаем нуклеотидную и получаем белковую последовательность).

Таким образом были получены 4 записи, из которых правдоподобными показались 2 (E-valueЭ меньше 1) - последовательности А и В, входящие в главный комплекс гистосовместимости (MHC) человека. Последовательность, закодированная в выбранном экзоне (6-89 аминокислотные остатки), отличалась 8ю остатками и 10ю остатками от 344-371 остатков последовательностей В и А соответственно.

Ссылки на записи EMBL в записи YECD_ECOLI (AC: P0ADI7) банка Swiss-Prot

В записи было найдено 5 ссылок на EMBL: AP009048 и BAA15678, U00096 и AAC74937, X53863.

Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания Описание Длина последовательности
AP009048 circular genomic DNA STD PRO 22-JAN-2006 Escherichia coli str. K12 substr. W3110 DNA, complete genome 4646332
BAA15678 (Parent accession AP009048.1) linear genomic DNA STD PRO Escherichia coli str. K-12 substr. W3110 predicted hydrolase 567
U00096 circular genomic DNA STD PRO 23-FEB-2006 Escherichia coli str. K-12 substr. MG1655, complete genome 4639675
AAC74937 (Parent accession U00096.2) linear genomic DNA STD PRO Escherichia coli str. K-12 substr. MG1655 predicted hydrolase 567
X53863 circular genomic DNA STD PRO 28-JAN-1991 E. coli aspS gene for aspartyl-tRNA synthetase (EC 6.1.1.12) 3868

Назад

2009 ©