Банк EMBL.

1. Знакомство со структурой банка EMBL посредством поисковой системы SRS.

a. Текущая версия (113) имеет 82772678 записей, проиндексированных 18-сентября-2012.

The various classes of data in the EMBL databanks are represented by three letter codes. A summary of all the codes is shown below:

CON: Constructed sequence
EST: Expressed Sequence Tag
GRV: Genome Reviews
GSS: Genome Survey Sequence (34528104)
HTC: High Throughput cDNA sequencing (491770)
HTG: High Throughput Genome sequencing (152599)
MGA: Mass Genome Annotation
PAT: Patent (24364832)
SET: Project set (EMBL WGS Masters only)
STD: Standard (13920617)
STS: Sequence Tagged Site (1322570)
TSA: Transcriptome Shotgun Assembly (7992186)
WGS: Whole Genome Shotgun
 
c. Division:
d*.На диаграмме видно, что скорость поступелния результатов в Division Fungi, Transgenic значительно выше, чем в Bacteriophage.

2. Описание гена в записи банка EMBL.

3. Нахождение белка по фрагменту гена.

a) В данном мне гене 2 самых длинных кодирующих участка по 276 нуклеотидов : 587712..5879887 и 588560..588835. Был выбран участок 588560..588835. С помощи программы seqret, чтобы вырезать этот участок:
seqret -sbegin 588560 -send 588835
Reads and writes (returns) sequences
Input (gapped) sequence(s): embl:BA000025
output sequence(s) [BA000025.fasta]:

b) Переходим на сайт BLAST. Проходим по ссылке на программу blastx(поиск белка в базе, используя в запросе транслирующую нуклеотидную последовательность). В окне Enter Query Sequence вводим последовательность из файла с вырезанной последовательностью, а в окне Database выбираем UniProtKB/Swiss-Prot(swissprot) и нажимаем кнопку BLAST.
Результатом является множество белков, 100% идентичность соответствует белку P30480, данным мне экзоном кодируется участок 208-298 аа. Участок, кодируемый экзоном, является IgC_MHC_I_alpha3 регионом. Белок является HLA class I histocompatibility antigen,B-42 alpha chain.

4. Ссылки из записи банка Swiss-Prot на записи банка EMBL

Таблица. Записи EMBL, в которых описан ген белка PTAS_BACSU.

ID записи Тип молекулы Класс данных Дата внесения в банк Описание Длина последовательности
X73124 genomic DNA std 02 ноября 1993 B.subtilis genomic region (325 to 333) 97015
AL009126 genomic DNA std 18 июля 2002 Bacillus subtilis subsp. subtilis str. 168 complete genome. 4215606


© Anna Butusova,2012