Банк EBML.

Главная

Структура банка EMBL

Дата последнего проиндексированного релиза EMBL: 8.09.2011, в нем 71833235 записей.

Список классов банка EMBL:

CON Constructed sequence не проиндексирован
EST Expressed Sequence Tag не проиндексирован
GRV Genome Reviews не проиндексирован
GSS Genome Survey Sequence 32578894
HTC High Throughput cDNA sequencing 533398
HTG High Throughput Genome sequencing 145701
MGA Mass Genome Annotation не проиндексирован
PAT Patent 22346593
SET Project set (EMBL WGS Masters only) не проиндексирован
STD Standard 11737741
STS Sequence Tagged Site 1322285
TSA Transcriptome Shotgun Assembly 3168623
WGS Whole Genome Shotgun не проиндексирован

Список разделов банка EMBL.

ENV Образцы среды 6637887
FUN Грибы 2219095
HUM Человек 10687844
INV Беспозвоночные 5906093
MAM Другие млекопитающие 5765536
MUS Mus musculus (мышь) 4779883
PHG Бактериофаги 8082
PLN Растения 17132180
PRO Прокариоты 1467025
ROD Грызуны 1265394
SYN Синтетические 3632878
TGN Трансгенные 265545
UNC Неклассифицированные 7500493
VRL Вирусы 1177936
VRT Другие позвоночные 3387364

Описание гена в записи банка EMBL

Ген HSR1, описанный в записи EMBL с кодом доступа BA000025 направлен прямо относительно направления, выбранного для записи, так как номера нуклеотидов стоят в прямом направлении.
Число кодирующих участков: 8
Длина первого кодирующего участка: 42
Длина последнего кодирующего участка: 242
Длина первого интрона: 1017
Длина последнего интрона: 382

Нахождение белка по фрагменту гена.

Самый длинный кодирующий участок (последний) был вырезан в отдельный файл программой seqret с опцией -sask, позволяющей вводить номера начальной и конечной последовательности, указанные в записи EMBL.

На главной странице Blast была выбрана программа blastx, которая ищет в белковых базах данных по данной нуклеотидной последовательности.

На вход программы была подана полученная программой seqret fasta-последовательность гена. В параметрах поиска была выбрана база данных Swissprot, а в поле "organism" введено "human".

В результате было получено 5 белков, только один из которых на 100% идентичен заданной последовательности. Это белок GNL1_HUMAN (гуаниновый нуклеотид-связывающий белок).

Ссылки из записи банка Swiss-Prot на записи банка EMBL.

Записи EMBL, в которых описан ген белка YESU_BACSU

ID записи Тип молекулы Класс данных Дата внесения в банк Описание Длина последовательности
AL009126 genomic DNA STD 18-JUL-2002 Bacillus subtilis subsp. subtilis str. 168 complete genome 4215606 BP
CAB12522 genomic DNA STD - Bacillus subtilis subsp. subtilis str. 168 conserved hypothetical protein 663 BP

Ген белка описан только в двух записях EMBL, одна из которых относится к собственно гену, кодирующему белок, а другая - ко всему геному бактерии.


©Гущина Ирина