Знакомство со структурой банка EMBL
посредством поисковой системы SRS
  1. Знакомство со структурой банка EMBL посредством поисковой системы SRS

Последний (109) релиз содержит 71833235 записей и был проиндексирован 08 сентября 2011 года.

Разные классы данных в банке EMBL обозначены трехбуквенным кодом. Для проиндексированных в скобках указанны количества записей.

		
CON: Constructed sequence
EST: Expressed Sequence Tag
GRV: Genome Reviews
GSS: Genome Survey Sequence                 (32578894)
HTC: High Throughput cDNA sequencing        (533398)
HTG: High Throughput Genome sequencing      (145701)
MGA: Mass Genome Annotation
PAT: Patent                                 (22346593)
SET: Project set (EMBL WGS Masters only)
STD: Standard                               (11737741)
STS: Sequence Tagged Site                   (1322285)
TSA: Transcriptome Shotgun Assembly         (3168623)
WGS: Whole Genome Shotgun
   


Разделы в банке данных EMBL


ENV: Environmental Samples - Образцы из среды  	6637887
FUN: Fungi - Грибы                          	2219095
HUM: Human - Человек                            10687844
INV: Invertebrates - Беспозвоночные         	5906093
MAM: Other Mammals - Прочие млекопитающие    	5765536
MUS: Mus musculus - Мышь домовая             	4779883
PHG: Bacteriophage - Бактериофаги            	8082
PLN: Plants - Растения                       	17132180
PRO: Prokaryotes - Прокариоты                	1467025
ROD: Rodents - Грызуны                       	1265394
SYN: Synthetic - Синтетические               	3632878
TGN: Transgenic - Трансгенные                	265545
UNC: Unclassified - Неклассифицированные     	7500493
VRL: Viruses - Вирусы                        	1177936
VRT: Other Vertebrates - Прочие позвоночные  	3387364
  


Количество поступлений в банк EMBL в 2010 и 2011 годах.

поступления в банк EMBL

В 2011 году поступило значительно больше метагеномов из среды, геномов трансгенных организмов и беспозвоночных, однако, количество записей, относящихся к человеку, снизилось.

  1. Описание гена в записи банка EMBL

Ген MicE.

Направление гена относительно направления, выбранного для записи - прямое.

Число кодирующих участков: 6.

Длины первого и последнего кодирующих участков: 75 и 303 соответственно.

Длины первого и последнего интронов между кодирующими участками: 252 и 2153 соответственно.


FT   CDS             join(2191157..2191231,2194405..2194659,2194898..2195182,
FT                   2195588..2195865,2195980..2196123,2198277..2198579)
FT                   /pseudo
FT                   /gene="MICE"
FT                   /note="MICA/B homologous"
FT                   /note="alternative name: PERB11.5"
FT   exon            2191157..2191231
FT                   /pseudo
FT                   /gene="MICE"
FT                   /number=1
FT   CDS             complement(2191484..2191880)
FT                   /pseudo
FT                   /gene="HCGIX-5"
FT                   /note="HCG family"
FT   exon            2191484..2191880
FT                   /pseudo
FT                   /gene="HCGIX-5"
FT                   /number=1
FT   exon            2194405..2194659
FT                   /gene="MICE"
FT                   /number=2
FT   exon            2194898..2195182
FT                   /gene="MICE"
FT                   /number=3
FT   exon            2195588..2195865
FT                   /gene="MICE"
FT                   /number=4
FT   exon            2195980..2196123
FT                   /gene="MICE"
FT                   /number=5
FT   exon            2198277..2198579
FT                   /gene="MICE"
FT                   /number=6


  1. Нахождение белка по фрагменту гена

Инструкция к поиску:

На сайте http://blast.ncbi.nlm.nih.gov/ выбрать программу blastx, вырезанный программой seqret участок можно скопировать в окошко или загрузить, не забыть в поле "database" выбрать "Swissprot".

В ходе поиска белок MicE не был обнаружен, но были найдены белки MicB и MicA, гомологичные ему.

Для белка MicB (первый по е-value) был обнаружен участок из 28 аминокислотных остатков, идентичный на 71% части транслировнанного экзона MicE (экзон 6, 303 пары оснований.)

В белке MicB он занимает позицию с 344 по 371 а.о.



  1. Ссылки из записи банка Swiss-Prot на записи банка EMBL
таблица ссылок на банк EMBL

В банке представлены записи, содержащие искомый ген(1993 год), участок бактериальной хромосомы, где он расположен,(1995) и полный геном B subtilis(2002)




© Eugenia Zotova