1.Пункт а.
Последний проиндексированного в системе релиза EMBL был 08-Sep-2011, он содержит 71833235 записей
Пункт b. В списке были представлены классы:
CON: Constructed sequence
EST: Expressed Sequence Tag
GRV: Genome Reviews
GSS: Genome Survey Sequence
HTC: High Throughput cDNA sequencing
HTG: High Throughput Genome sequencing
MGA: Mass Genome Annotation
PAT: Patent
SET: Project set (EMBL WGS Masters only)
STD: Standard
STS: Sequence Tagged Site
TSA: Transcriptome Shotgun Assembly
WGS: Whole Genome Shotgun
Из них в последнем релизе проиндексированы:
GSS - 32578894 записей
HTC - 533398 записей
HTG - 145701 записей
PAT - 22346593 записей
STD - 11737741 записей
STS - 1322285 записей
TSA - 3168623 записей
CON, EST, GRV, MGA, SET, WGS не проиндексированы.
Пункт c. Разделы банка:
ENV: Environmental Samples - материалы из проб окружающей среды
FUN: Fungi - грибы
HUM: Human - человек
INV: Invertebrates - беспозвоночные
MAM: Other Mammals - другие млекопитающие
MUS: Mus musculus - домовая мышь
PHG: Bacteriophage - бактериофаги
PLN: Plants - растения
PRO: Prokaryotes - прокариоты
ROD: Rodents - грызуны
SYN: Synthetic - синтетические нуклеиновые кислоты
TGN: Transgenic - трансгенные организмы
UNC: Unclassified - неотклассифицированные
VRL: Viruses - вирусы
VRT: Other Vertebrates - другие позвоночные
HLA-F
Направление обратное, 8 кодирующих участков. Длина первого экзона 64, восьмого 5. Длина первого интрона 130, последнего 176.
У меня было два экзона с длиной 276, я выбрала №3. Для поиска надо использовать blastx, на вход дать последовательность в fasta-формате и выбрать базу Swissprot. Я получила два белка с участком, совпадающим с моим экзоном. Один из них сам HLA-F(HLAF_HUMAN), другой PATR-F(1C28_PANTR), причем в обоих участки 113-203.
Ссылки из записи банка Swiss-Prot на записи банка EMBL
EMBL | ID | Molecule | Class | SeqLength | DateCreated | Description |
EMBL:AL009126 | AL009126 |
genomic DNA |
STD |
4215606 |
18-JUL-2002 |
Bacillus subtilis subsp. subtilis str. 168 complete genome. |
EMBL:J02732 | J02732 |
genomic DNA |
STD |
13339 |
19-APR-1990 |
B.subtilis pur operon encoding purine biosynthesis enzymes, 12 genes. |
Полученные записи - это полный геном Bacillus subtilis и запись, в которой есть этот ген.