Банк нуклеотидных последовательностей EMBL


        EMBL release
        1.Последний релиз был проиндексирован 7 сентября 2009 года и содержит 108577013 записей.
        Поле Data class (с количеством записей каждого класса - для тех, где указаны)
ANN: Constructed sequence with annotation
CON: Constructed sequence
EST: Expressed Sequence Tag (62846990)
GRV: Genome Reviews -
GSS: Genome Survey Sequence (25905073)
HTC: High Throughput cDNA sequencing (549753)
HTG: High Throughput Genome sequencing (142473)
MGA: Mass Genome Annotation -
PAT: Patent (10439165) -
SET: Project set (EMBL WGS Masters only)
STD: Standard (7253026) -
STS: Sequence Tagged Site (1310171)
TPA: Third Party Annotation (6520)
TSA: Transcriptome Shotgun Assembly (123842)
WGS: Whole Genome Shotgun -
         
        Поле Division
ENV: Природные образцы (4145029)
FUN: Грибы (3942084)
HUM: Человек (12841544) 
INV: Беспозвоночные (15518735)
MAM: Другие млекопитающие (9429823)
MUS: Мышь (7424621)
PHG: Бактериофаги (5865)
PLN: Растения (33806044)
PRO: Прокариоты (909986)
ROD: Грызуны (2261678)
SYN: Искусственно создано (2671622)
TGN: Трансгенные организмы (265465)
UNC: Не классифицировано (3945859)
VRL: Вирусы (827405)
VRT: Другие позвоночные (10581253)

        

        Наблюдается замедление поступлений в данные три раздела, и наиболее разительное - в раздел "Человек"

        2.Ген HLA-B (код доступа к записи EMBL BA000025)
        Направление: прямое
        Кодирующих участков: 7
        Длина первого к.у.: 73
        Длина последнего к.у.: 44 
        Длина первого интрона: 128
        Длина последнего интрона: 106

        Страничка ввода программы blastx
        Нужная последовательность вводится в поле запроса (в данном случае экзон №3 - 587712...587987)
        Выбираем Swiss-Prot в качестве банка данных, где будем искать.
        Находим белок с наименьшим E-value выравнивания (1e-04) - 3 варианта: 
        антигены гистосовместимости человека класса I B-8, B-41 и B-42 (1B08, 1B41 и 1B42)
        участок последовательности, соответствующий экзону - 188-206 (стопроцентное совпадение)

        3.AHPF_Ecoli

      
Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
документа
Описание Длина последовательности
U82598 геномная ДНК STD PRO 21 января 1997 последовательность генома Escherichia coli с 9 по 12 минуты 136742
D13187 геномная ДНК STD PRO 30 августа 1993 гены ahpC и ahpC Escherichia coli, малой и большой субъединиц алкилгидропероксидредуктазы, полная и частичная посл-ти 1483
AP009048 геномная ДНК STD PRO 22 января 2006 полный протеом Escherichia coli K12 W3110 4646332
U00096 геномная ДНК STD PRO 22 февраля 2006 полный протеом Escherichia coli K12 MG1655 4639675
Первая запись содержит информацию о целом участке генома, кодирующем 135 белков, вторая - о генах двух субъединиц одного белка - F и С, а третья и четвёртая - о полном наборе белков и кодирующих их генов разных штаммов Escherichia coli. Последние две заметно новее, но все записи относятся к одному разделу и классу данных.


К перечню исследовательских работ
На главную