Банк EMBL

1. Знакомство со структурой банка EMBL посредством поисковой системы SRS
Дата последнего проиндексированного релиза EMBL: 8 сентября 2011 года.Количество записей - 71833235 записей.
Cписок классов ("Data Class") банка EMBL
    CON: Constructed sequence
    EST: Expressed Sequence Tag
    GRV: Genome Reviews
    GSS: Genome Survey Sequence
    HTC: High Throughput cDNA sequencing
    HTG: High Throughput Genome sequencing
    MGA: Mass Genome Annotation
    PAT: Patent
    SET: Project set (EMBL WGS Masters only)
    STD: Standard
    STS: Sequence Tagged Site
    TSA: Transcriptome Shotgun Assembly
    WGS: Whole Genome Shotgun
Классы, проиндексированные SRS для последнего релиза EMBL,и число записей в них:
    gss      32578894
    htc      533398
    htg      145701
    pat      22346593
    std      11737741
    sts      1322285
    tsa      3168623
Не проиндексированы записи классов: CON,EST,GRV,MGA,SET,WGS.
Cписок разделов ("Divisions") банка EMBL:

ENV 	Образцы среды 	           6637887
FUN 	Грибы 	                   2219095
HUM 	Человек 	           10687844
INV 	Беспозвоночные 	           5906093
MAM 	Другие млекопитающие       5765536
MUS 	Mus musculus (мышь) 	   4779883
PHG 	Бактериофаги               8082
PLN 	Растения 	           17132180
PRO 	Прокариоты 	           1467025
ROD 	Грызуны 	           1265394
SYN 	Синтетические 	           3632878
TGN 	Трансгенные 	           265545
UNC 	Неклассифицированные       7500493
VRL 	Вирусы 	                   1177936
VRT 	Другие позвоночные 	   3387364    
2. Описание гена CSNK2B в записи банка EMBL.

FT   exon            273962..274192
FT                   /gene="CSNK2B"
FT                   /number=7
FT   CDS             complement(join(274102..274192,274520..274709,
FT                   274856..274931,275374..275489,276058..276160,
FT                   277125..277196))
FT                   /codon_start=1
FT                   /transl_table=1
FT                   /gene="CSNK2B"
FT                   /product="Casein kinase II beta subunit"
FT                   /note="alternative name: G5a, phosvitin"
FT                   /db_xref="GDB:125235"
FT                   /db_xref="GOA:P67870"
FT                   /db_xref="HGNC:2460"
FT                   /db_xref="InterPro:IPR000704"
FT                   /db_xref="PDB:1DS5"
FT                   /db_xref="UniProtKB/Swiss-Prot:P67870"
FT                   /protein_id="BAB63386.1"
FT                   /translation="MSSSEEVSWISWFCGLRGNEFFCEVDEDYIQDKFNLTGLNEQVPH
FT                   YRQALDMILDLEPDEELEDNPNQSDLIEQAAEMLYGLIHARYILTNRGIAQMLEKYQQG
FT                   DFGYCPRVYCENQPMLPIGLSDIPGEAMVKLYCPKCMDVYTPKSSRHHHTDGAYFGTGF
FT                   PHMLFMVHPEYRPKRPANQFVPRLYGFKIHPMAYQLQLQAASNFKSPVKTIR"
FT   exon            274520..274709
FT                   /gene="CSNK2B"
FT                   /number=6
FT   exon            274856..274931
FT                   /gene="CSNK2B"
FT                   /number=5
FT   exon            275374..275489
FT                   /gene="CSNK2B"
FT                   /number=4
FT   exon            276058..276160
FT                   /gene="CSNK2B"
FT                   /number=3
FT   exon            277125..277207
FT                   /gene="CSNK2B"
FT                   /number=2
FT   exon            277820..278148
FT                   /gene="CSNK2B"
FT                   /number=1
FT   exon            279023..279187  
-напрвление гена обратное относительно выбранного для записи
-число кодирующих участков - 6
-длина первого кодирующего участка - 91
-длина последнего кодирующего участка -72
-длина первого интрона - 327
-длина последнего интрона - 964

3. Нахождение белка по фрагменту гена
Самый длинный кодирующий участок - 190 н. (274520..274709).Он ( в формате fasta ) был вырезан с помощью программы seqret с опцией -sask. Была выбрана программа blastx, которая ищет в белковых базах данных по данной нуклеотидной последовательности. База данных -Swissprot.Программа выдала 56 белков, в том числе и искомый - Casein kinase II subunit beta (Protein G5a)- бета-субъединица казеин киназы II, участок белка : 124-185.

4. Ссылки из записи банка Swiss-Prot на записи банка EMBL

Таблица. Записи EMBL, в которых описан ген белка ABNA_BACSU
ID записи Тип молекулы Класс данных Дата внесения в банк Описание Длина последовательности
Z75208.1 linear genomic DNA STD 08-JAN-1997 B.subtilis genomic sequence 89009bp 89009 BP
AY669857 linear genomic DNA STD 10-DEC-2004 Bacillus subtilis strain 168T+ endo-1,5-arabinanase gene, complete cds. 1277 BP
AL009126 circular genomic DNA STD 18-JUL-2002 Bacillus subtilis subsp. subtilis str. 168 complete genome. 4215606 BP
На страницу 3 семестра
На главную страницу
© Акулич Ксения,2010