EMBL (Release)
Последний релиз проиндексирован 7 сентября 2009 и содержит 108577013 записей.
Data class
Список классов:
- ANN: Constructed sequence with annotation
- CON: Constructed sequence
- EST: Expressed Sequence Tag
- GRV: Genome Reviews
- GSS: Genome Survey Sequence
- HTC: High Throughput cDNA sequencing
- HTG: High Throughput Genome sequencing
- MGA: Mass Genome Annotation
- PAT: Patent
- SET: Project set (EMBL WGS Masters only)
- STD: Standard
- STS: Sequence Tagged Site
- TPA: Third Party Annotation
- TSA: Transcriptome Shotgun Assembly
- WGS: Whole Genome Shotgun
Проиндексированы записи следующих классов:
- EST: 62846990 записей
- GSS: 25905073 записи
- HTC: 549753 записи
- HTG: 142473 записи
- PAT: 10439165 записей
- STD: 7253026 записей
- STS: 1310171 запись
- TPA: 6520 записей
- TSA: 123842 записи
Не проиндексированы записи следующих классов:
- ANN: Constructed sequence with annotation
- CON: Constructed sequence
- GRV: Genome Reviews
- MGA: Mass Genome Annotation
- SET: Project set (EMBL WGS Masters only)
- WGS: Whole Genome Shotgun
Divisions
Обозначение
| Описание
| Число записей
|
ENV
| Образцы из окружающей среды
| 4145029
|
FUN
| Грибы
| 3942084
|
HUM
| Человек
| 12841544
|
INV
| Беспозвоночные
| 15518735
|
MAM
| Другие млекопитающие
| 9429823
|
MUS
| Домовая мышь
| 7424621
|
PHG
| Бактериофаги
| 5865
|
PLN
| Растения
| 33806044
|
PRO
| Прокариоты
| 909986
|
ROD
| Грызуны
| 2261678
|
SYN
| Синтетические
| 2671622
|
TGN
| Трансгенные
| 265465
|
UNC
| Неклассифицированные
| 3945859
|
VRL
| Вирусы
| 827405
|
VRT
| Другие позвоночные
| 10581253
|
Информация о гене MICA из записи BA000025
Направление гена относительно направления, выбранного для записи: обратное.
Число кодирующих участков: 5
Длина первого кодирующего участка: 107
Длина последнего кодирующего участка: 70
Длина первого интрона: 99
Длина последнего интрона: 6840
Поиск белка по кодирующему участку гена
Самый длинный кодирующий участок: (532785..533072) - 288 нуклеотидов.
С помощью программы seqret был получен файл ba000025.fasta с последовательностью этого кодирующего участка.
C помощью программы blastx (поиск аминокислотной последовательности по соответствующей нуклеотидной последовательности), используя полученный нами файл ba000025.fasta, в базе swissprot было найдено 8 белков.
Лучшая находка - Q29983 (E-value = 5e-25). Экзон соответствует участку белка с 110го по 204й а.о.
Характеристика записей EMBL (по записи P77791 банка Swissprot)
Идентификатор записи EMBL
| Тип молекулы
| Класс данных
| Раздел EMBL
| Длина последовательности |
Дата создания документа
| Описание
|
AJ223173
| Genomic_DNA
| STD
| PRO
| 552
| 28-JAN-1998
| Escherichia coli Maltose Transacetylase orf (maa)
|
U82664
| Genomic_DNA
| STD
| PRO
| 139818
| 19-JAN-1997
| Escherichia coli minutes 9 to 11 genomic sequence.
|
U00096
| Genomic_DNA
| STD
| PRO
| 4639675
| 23-FEB-2006
| Escherichia coli str. K-12 substr. MG1655, complete genome.
|
AP009048
| Genomic_DNA
| STD
| PRO
| 4646332
| 22-JAN-2006
| Escherichia coli str. K12 substr. W3110 DNA, complete genome.
|
Назад
|