Задание1 a).Последний релиз(109) был проиндексирован 08-Sep-2011 и имеет 71833235 записей
b).Class
Description
(EMBLRELEASE) The various classes of data in the EMBL databanks are represented by three letter codes. A summary of all the codes is shown below:

CON: Constructed sequence
EST: Expressed Sequence Tag
GRV: Genome Reviews
GSS: Genome Survey Sequence
HTC: High Throughput cDNA sequencing
HTG: High Throughput Genome sequencing
MGA: Mass Genome Annotation
PAT: Patent
SET: Project set (EMBL WGS Masters only)
STD: Standard
STS: Sequence Tagged Site
TSA: Transcriptome Shotgun Assembly
WGS: Whole Genome Shotgun

Values in EMBLRELEASE for last indexed release

Value No of Entries

gss 32578894
htc 533398
htg 145701
pat 22346593
std 11737741
sts 1322285
tsa 3168623
c).Division
Description
(EMBLRELEASE) Различные таксономические разделы в банках данных EMBL представлены 3-хбуквенными обозначениями. Краткое описание всех обозначений преведено снизу:

ENV: Природные образцы
FUN: Грибы
HUM: Человек
INV: Беспозвоночные
MAM: Другие млекопитающие
MUS: Домовая мышь
PHG: Бактериофаги
PLN: Растения
PRO: Прокариоты
ROD: Грызуны
SYN: Синтетические
TGN: Трансгенные организмы
UNC: Неклассифицированные организмы
VRL: Вирусы
VRT: Другие позврночные


Values in EMBLRELEASE
Value No of Entries
env 6637887
fun 2219095
hum 10687844
inv 5906093
mam 5765536
mus 4779883
phg 8082
pln 17132180
pro 1467025
rod 1265394
syn 3632878
tgn 265545
unc 7500493
vrl 1177936
vrt 3387364

d)

2.Ген-HLA-B.
направление-прямое
FT CDS join(586995..587067,587196..587465,587712..587987,
FT 588560..588835,588929..589045,589487..589519,
FT 589626..589669)
FT /codon_start=1
FT /transl_table=1
FT /gene="HLA-B"
FT /note="Classical HLA Class I gene"
FT /db_xref="GDB:120048"
FT /db_xref="GOA:P30460"
FT /db_xref="HGNC:4932"
FT /db_xref="InterPro:IPR010579"
FT /db_xref="PDB:1AGB"
FT /db_xref="UniProtKB/Swiss-Prot:P30460"
FT /protein_id="BAB63309.1"
FT /translation="MLVMAPRTVLLLLSAALALTETWAGSHSMRYFDTAMSRPGRGEPR
FT FISVGYVDDTQFVRFDSDAASPREEPRAPWIEQEGPEYWDRNTQIFKTNTQTDRESLRN
FT LRGYYNQSEAGSHTLQSMYGCDVGPDGRLLRGHNQYAYDGKDYIALNEDLRSWTAADTA
FT AQITQRKWEAARVAEQDRAYLEGTCVEWLRRYLENGKDTLERADPPKTHVTHHPISDHE
FT ATLRCWALGFYPAEITLTWQRDGEDQTQDTELVETRPAGDRTFQKWAAVVVPSGEEQRY
FT TCHVQHEGLPKPLTLRWEPSSQSTVPIVGIVAGLAVLAVVVIGAVVAAVMCRRKSSGGK
FT GGSYSQAACSDSAQGSDVSLTA"
FT exon 586995..587067
FT /gene="HLA-B"
FT /number=1
FT misc_feature 587194..587996
FT /gene="HLA-B"
FT /note="match HLA-B (M59841) with account of intervene
FT sequences."
FT exon 587196..587465
FT /gene="HLA-B"
FT /number=2
FT exon 587712..587987
FT /gene="HLA-B"
FT /number=3
FT exon 588560..588835
FT /gene="HLA-B"
FT /number=4
FT misc_feature 588678..588818
FT /gene="HLA-B"
FT /note="match HLA-B (V00527) with account of intervene
FT sequences."
FT exon 588929..589045
FT /gene="HLA-B"
FT /number=5
FT exon 589487..589519
FT /gene="HLA-B"
FT /number=6
FT exon 589626..589673
FT /gene="HLA-B"
FT /number=7
FT exon 589856..590278
FT /gene="HLA-B"
FT /number=8
FT CDS 597612..598537
FT /pseudo
FT /gene="HCGII-1"
FT /note="HCG family"
FT exon 597612..598537
FT /pseudo
FT /gene="HCGII-1"
FT /number=1

    1. число кодирующих участков-7
        длина первого кодирующего участка-73
          длина последнего кодирующего участка-44
            длина первого интрона-128
              длина последнего интрона-106 3."Фаста -формат выбранного участка"
              В гене 2 самых длинных кодирующих участков:587712..587987,588560..588835.Длина обоих составляет 276 нуклеотидов.
              Для работы с программой seqret был выбран 1 участок.
              Схема работы с seqret:
              seqret -sbegin 587712 -send 587987
              Reads and writes (returns) sequences
              Input (gapped) sequence(s): embl:BA000025
              output sequence(s) [BA000025.fasta]:
              Схема подачи на вход:
              Переходим на сайт программы BLASЕ.Находим ссылку blasttx,переходим по ней.Затем вводим fasta-последовательность,выбираем базу данных(swissprot) и организм Homo sapiens.
              Результат-белок 1BO8_HUMAN.362 а.а,AC-P30460.Антиген 1 класса HLA.
              Участку экзона(query)соответствует следующий участок(sbjct)
              Query 3 SHTLQSMYGCDVGPDGRLLRGHNQYAYDGKDYIALNEDLRSWTAADTAAQITQRKWEAAR 182
              SHTLQSMYGCDVGPDGRLLRGHNQYAYDGKDYIALNEDLRSWTAADTAAQITQRKWEAAR
              Sbjct 116 SHTLQSMYGCDVGPDGRLLRGHNQYAYDGKDYIALNEDLRSWTAADTAAQITQRKWEAAR 175
              Query 183 VAEQDRAYLEGTCVEWLRRYLENGKDTLERA 275
              VAEQDRAYLEGTCVEWLRRYLENGKDTLERA
              Sbjct 176 VAEQDRAYLEGTCVEWLRRYLENGKDTLERA 206
              4.* Таблица. Записи EMBL, в которых описан ген белка SPSA_BACSU X73124 Genomic DNA. Translation: CAA51619.1. AL009126 Genomic DNA. Translation: CAB15817.1.

              ID записи

              Тип молекулы

              Класс данных

              Дата внесения в банк

              Описание

              Длина последовательности

              AL009126 genomic DNA STD 18-JUL-2002 Bacillus subtilis subsp. subtilis str. 168 complete genome.. 4215606
              X73124 genomic DNA STD 02-NOV-1997 B.subtilis genomic region (325 to 333) 97015