EMBL (Release)

Последний релиз проиндексирован 7 сентября 2009 и содержит 108577013 записей.

Data class

Список классов:
  • ANN: Constructed sequence with annotation
  • CON: Constructed sequence
  • EST: Expressed Sequence Tag
  • GRV: Genome Reviews
  • GSS: Genome Survey Sequence
  • HTC: High Throughput cDNA sequencing
  • HTG: High Throughput Genome sequencing
  • MGA: Mass Genome Annotation
  • PAT: Patent
  • SET: Project set (EMBL WGS Masters only)
  • STD: Standard
  • STS: Sequence Tagged Site
  • TPA: Third Party Annotation
  • TSA: Transcriptome Shotgun Assembly
  • WGS: Whole Genome Shotgun
Проиндексированы записи следующих классов:
  • EST: 62846990 записей
  • GSS: 25905073 записи
  • HTC: 549753 записи
  • HTG: 142473 записи
  • PAT: 10439165 записей
  • STD: 7253026 записей
  • STS: 1310171 запись
  • TPA: 6520 записей
  • TSA: 123842 записи
Не проиндексированы записи следующих классов:
  • ANN: Constructed sequence with annotation
  • CON: Constructed sequence
  • GRV: Genome Reviews
  • MGA: Mass Genome Annotation
  • SET: Project set (EMBL WGS Masters only)
  • WGS: Whole Genome Shotgun

Divisions

Обозначение Описание Число записей
ENV Образцы из окружающей среды 4145029
FUN Грибы 3942084
HUM Человек 12841544
INV Беспозвоночные 15518735
MAM Другие млекопитающие 9429823
MUS Домовая мышь 7424621
PHG Бактериофаги 5865
PLN Растения 33806044
PRO Прокариоты 909986
ROD Грызуны 2261678
SYN Синтетические 2671622
TGN Трансгенные 265465
UNC Неклассифицированные 3945859
VRL Вирусы 827405
VRT Другие позвоночные 10581253

Информация о гене MICA из записи BA000025

Направление гена относительно направления, выбранного для записи: обратное.
Число кодирующих участков: 5
Длина первого кодирующего участка: 107
Длина последнего кодирующего участка: 70
Длина первого интрона: 99
Длина последнего интрона: 6840

Поиск белка по кодирующему участку гена

Самый длинный кодирующий участок: (532785..533072) - 288 нуклеотидов.
С помощью программы seqret был получен файл ba000025.fasta с последовательностью этого кодирующего участка.
C помощью программы blastx (поиск аминокислотной последовательности по соответствующей нуклеотидной последовательности), используя полученный нами файл ba000025.fasta, в базе swissprot было найдено 8 белков.
Лучшая находка - Q29983 (E-value = 5e-25). Экзон соответствует участку белка с 110го по 204й а.о.

Характеристика записей EMBL (по записи P77791 банка Swissprot)

Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Длина последовательности Дата создания
документа
Описание
AJ223173 Genomic_DNA STD PRO 552 28-JAN-1998 Escherichia coli Maltose Transacetylase orf (maa)
U82664 Genomic_DNA STD PRO 139818 19-JAN-1997 Escherichia coli minutes 9 to 11 genomic sequence.
U00096 Genomic_DNA STD PRO 4639675 23-FEB-2006 Escherichia coli str. K-12 substr. MG1655, complete genome.
AP009048 Genomic_DNA STD PRO 4646332 22-JAN-2006 Escherichia coli str. K12 substr. W3110 DNA, complete genome.


Назад