Знакомство со структурой банка EMBL посредством поисковой системы SRS
Текущий релиз (109) имеет 71833235 последовательностей и индексирован 08-Sep-2011.
Список классов (Непроиндексированы те классы, у которых справа нет числа):
CON: Constructed sequence
EST: Expressed Sequence Tag
GRV: Genome Reviews
GSS: Genome Survey Sequence 32578894
HTC: High Throughput cDNA sequencing 533398
HTG: High Throughput Genome sequencing 145701
MGA: Mass Genome Annotation
PAT: Patent 22346593
SET: Project set (EMBL WGS Masters only)
STD: Standard 11737741
STS: Sequence Tagged Site 1322285
TSA: Transcriptome Shotgun Assembly 3168623
WGS: Whole Genome Shotgun
Подразделения (Division) в EMBL и их число в последнем релизе:
ENV: Образцы окружающей среды 6637887
FUN: Грибы 2219095
HUM: Человек 10687844
INV: Беспозвоночные 5906093
MAM: Другие млекопитающие 5765536
MUS: Мышь 4779883
PHG: Бактериофаги 8082
PLN: Растения 17132180
PRO: Прокариоты 1467025
ROD: Грызуны 1265394
SYN: Синтетические конструкции 3632878
TGN: Трансгенные образцы 265545
UNC: Неклассифицированные 7500493
VRL: Вирусы 1177936
VRT: Другие позвоночные 3387364
Дополниетльно*
xlsx- ФАЙЛ с диаграммой
Описание гена в записи банка EMBL
Ген находится в комплементарной цепи, что значит что направление обратное.
Число кодирующих участков (экзонов):5
Длина первого из них: 128
Последнего: 256
Длина 1-го интрона: 2568
Последнего: 266
Нахождение белка по фрагменту гена
1. Сначала выбираем самый длинный участок
2. Затем командой seqret embl:BA000025 -sask
"вытаскиваем" этот фрагмент
3. После, программой BLASTx ищем наш белок.
Найдено много протеинов с идентичностью 65% и меньше
Протеин MHC class I polypeptide-related sequence A,
соответствует моему экзону на участке с 243 по 294 остаткок.
Ссылки из записи банка Swiss-Prot на записи банка EMBL
Ссылки:
DR EMBL; M59757; AAA21273.1; -; Genomic_DNA.
DR EMBL; AL009126; CAB13429.1; -; Genomic_DNA.
