Знакомство со структурой банка EMBL c помощью поисковой системы SRS


1)a

Последний релиз (109-ый) 8 сентября 2011 года содержит 71833235 записи

1)b

Число записей в различных классах:  

CON: Constructed sequence 
EST: Expressed Sequence Tag 
GRV: Genome Reviews 
GSS: Genome Survey Sequence              32578894 записи
HTC: High Throughput cDNA sequencing     533398
HTG: High Throughput Genome sequencing   145701
MGA: Mass Genome Annotation 
PAT: Patent                              22346593
SET: Project set (EMBL WGS Masters only) 
STD: Standard                            11737741
STS: Sequence Tagged Site                1322285
TSA: Transcriptome Shotgun Assembly      3168623
WGS: Whole Genome Shotgun 

1)c

Количество записей в "Division":  

ENV: Environmental Samples (Виды из окруж. среды)        6637887 записей
FUN: Fungi (Грибы)                                       2219095  
HUM: Human (Человек)                                     10687844 
INV: Invertebrates  (Беспозвоночные)                     5906093  
MAM: Other Mammals (Другие млекопитающие)                5765536  
MUS: Mus musculus (Мышь домовая)                         4779883  
PHG: Bacteriophage (Бактериофаги)                        8082     
PLN: Plants (Растения)                                   17132180 
PRO: Prokaryotes (Прокариоты)                            1467025  
ROD: Rodents  (Грызуны)                                  1265394  
SYN: Synthetic  (Синтетические)                          3632878  
TGN: Transgenic (Трансгенные)                            265545   
UNC: Unclassified  (Неклассифицированные)                7500493  
VRL: Viruses   (Вирусы)                                  1177936  
VRT: Other Vertebrates (Другие позвоночные)              3387364  


2)


Ген: CLIC1

Направление гена прямое;
6 кодирующих участков;
Длины первого и последнего кодирующих участков: 39 и 161 соответственно.
Длины первого и последнего интронов между кодирующими участками: 2002 и 1213 соответственно.


FT                   /gene="CLIC1"
FT                   /number=1
FT   CDS             join(207725..207763,209766..209875,210068..210193,
FT                   210357..210463,211631..211812,213026..213187)
FT                   /codon_start=1
FT                   /transl_table=1
FT                   /gene="CLIC1"
FT                   /product="nuclear chloride ion channel protein"
FT                   /note="alternative name: NCC27, G6, CLCP, p64"
FT                   /db_xref="GDB:6278990"
FT                   /db_xref="GOA:O00299"
FT                   /db_xref="HGNC:2062"
FT                   /db_xref="InterPro:IPR012335"
FT                   /db_xref="PDB:1K0M"
FT                   /db_xref="UniProtKB/Swiss-Prot:O00299"
FT                   /protein_id="BAB63376.1"
FT                   /translation="MAEEQPQVELFVKAGSDGAKIGNCPFSQRLFMVLWLKGVTFNVTT
FT                   VDTKRRTETVQKLCPGGQLPFLLYGTEVHTDTNKIEEFLEAVLCPPRYPKLAALNPESN
FT                   TAGLDIFAKFSAYIKNSNPALNDNLEKGLLKALKVLDNYLTSPLPEEVDETSAEDEGVS
FT                   QRKFLDGNELTLADCNLLPKLHIVQVVCKKYRGFTIPEAFRGVHRYLSNAYAREEFAST
FT                   CPDDEEIELAYEQVAKALK"
FT   exon            209766..209875
FT                   /gene="CLIC1"
FT                   /number=2
FT   exon            210068..210193
FT                   /gene="CLIC1"
FT                   /number=3
FT   exon            210357..210463
FT                   /gene="CLIC1"
FT                   /number=4
FT   exon            211631..211812
FT                   /gene="CLIC1"
FT                   /number=5
FT   exon            213026..213434
FT                   /gene="CLIC1"
FT                   /number=6
FT   exon            214850..215164


3)


Для поиска я воспользовался программой blastx, т.к.
программа по последовательности ДНК выдает белок с
наиболее похожей кодирующей последовательностью.

Был найден мой белок: Chloride intracellular channel protein 1 (O00299.4) 
(Хлорный внутреклеточный канальный белок 1) с E-value= 3e-35

Данный экзон (211631..211812) в последовательности ДНК (во всей последовательности), 
соответствует 129 -188 аа в кодируемом белке

4)


Записи EMBL, в которых описан ген белка YXBC_BACSU:


ID записи

Тип молекулы

Класс данных

Дата внесения в банк

Описание

Длина последовательности

AB005554

genomic DNA

STD

25-JUL-1997

Bacillus subtilis genomic DNA, 36 kb region between gnt and iol operons

36448

AL009126

genomic DNA

STD

18-JUL-2002

Bacillus subtilis subsp. subtilis str. 168 complete genome

4215606



Главная страница (см. ниже)

©Abdullaev Eldar