Банк нуклеотидных последовательностей EMBL

Релиз содержит 99848570 записей, дата последней индексации - 21 января 2009.
Обозначение Oписание Kоличество
ANN Constructed sequence with annotation 0
CON Constructed sequence0
EST Expressed Sequence Tag59604001
GRV Genome Reviews0
GSS Genome Survey Sequence 24670960
HTC High Throughput cDNA sequencing 531582
HTG High Throughput Genome sequencing 139369
MGA Mass Genome Annotation 0
PAT Patent 7324419
SET Project set (EMBL WGS Masters only) 0
STD Standard 6263421
STS Sequence Tagged Site 1305218
TPA Third Party Annotation 6119
TSA Transcriptome Shotgun Assembly 3481
WGS Whole Genome Shotgun 0

Обозначение Oписание Описание Кол-во
ENV Environmental SamplesОбразцы окружающей среды 3735223
FUN Fungi Грибы3231825
HUM Human Человек11807708
INV Invertebrates Беспозвоночные14294051
MAM Other Mammals Другие млекопитающие8686059
MUS Mus musculus Геном мыши 7330487
PHG Bacteriophage Бактериофаг4896
PLN Plants Растения 28334269
PRO Prokaryotes Прокариоты675972
ROD Rodents Грызуны 1804253
SYN Synthetic Синтезированный1500620
TGN Transgenic Трансгенный265445
UNC Unclassified Не относящийся ни к кому2956530
VRL Viruses Вирусы624900
VRT Other Vertebrates Другие позвоночные9288565

Ген CSNK2B
Форма записи - reverse
Кодирующих участков 6
Длина первого и последнего кодирующего участка: (274102..274192) 91, (277125..277196) 72.
Длины первого и последнего интронов: (274192,274520) 329, (276160,277125) 964.
Самый длинный экзон, вырезанный с помощью
программы seqret ba000025.fasta.
Для поиска последовательности белка, соответствующего экзону необходимо:
1) Зайти на сайт Blast.
2) Выбрать программу blastx
3) Загрузить полученный выше файл в поле upload file
4) Выбрать Базу данных SwissProt
5) Нажать кнопку Blast
В заметках к гену указан продукт бета-субъединица казеин-киназы (Casein kinase II beta subunit) и его идентефикатор UniProtKB/Swiss-Prot:P67870 . При поиске по первому, самому длинному экзону по базе данных SWISS-PROT, никаких адекватных результатов нет (всего три находки с E-Value больше 4). Если искать по Refseq_protein, находится белок PREDICTED: similar to casein kinase 2, beta subunit [Canis familiaris]. Видимо, соответствующий этому экзону участок белка подвергается сильной модификации или вообще отрезается и в "рабочей" версии белки он не находится. Если взять второй экзон (предпоследний 274520..274709) и вырезать его ba.fasta, топервая же находка соответствует серии казеиновых киназ (именно II и бета-субъединицы ) из разных организмов. Хотя CSK2B_DANRE - лошадь в списке первая, кроме нее в списке есть и крыса, и кролик, и , собственно, человек.

Идетификаторы EMBL в SwissProt записи белка GLPK_Ecoli
Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
документа
Описание Длина последовательности
M18393 genomic DNA STD PRO 16-JUL-1988 E.coli glp-kappa gene encoding glycerol kinase, complete cds. 2028
M55990; genomic DNA STD PRO 21-JUL-1991 E.coli glycerol diffusion facilitator (glpF) and glycerol kinase (glpK) genes, complete cds. 1504
L19201 genomic DNA STD PRO 31-AUG-1993 E. coli chromosomal region from 87.2 to 89.2 minutes.. 96484
U00096; genomic DNA STD PRO 23-FEB-2006 Escherichia coli str. K-12 substr. MG1655, complete genome. 4639675
AP009048 genomic DNA STD PRO 22-JAN-2006 Escherichia coli str. K12 substr. W3110 DNA, complete genome. 4646332
ма