![]() |
![]() |
![]() |
a. Текущая версия (113) имеет 82772678 записей, проиндексированных 18-сентября-2012.
The various classes of data in the EMBL databanks are represented by three letter codes. A summary of all the codes is shown below: CON: Constructed sequence EST: Expressed Sequence Tag GRV: Genome Reviews GSS: Genome Survey Sequence (34528104) HTC: High Throughput cDNA sequencing (491770) HTG: High Throughput Genome sequencing (152599) MGA: Mass Genome Annotation PAT: Patent (24364832) SET: Project set (EMBL WGS Masters only) STD: Standard (13920617) STS: Sequence Tagged Site (1322570) TSA: Transcriptome Shotgun Assembly (7992186) WGS: Whole Genome Shotgunc. Division:
a) В данном мне гене 2 самых длинных кодирующих участка по 276 нуклеотидов : 587712..5879887 и 588560..588835. Был выбран участок 588560..588835. С помощи программы seqret, чтобы вырезать этот участок:
seqret -sbegin 588560 -send 588835
Reads and writes (returns) sequences
Input (gapped) sequence(s): embl:BA000025
output sequence(s) [BA000025.fasta]:
b) Переходим на сайт BLAST. Проходим по ссылке на программу blastx(поиск белка в базе, используя в запросе транслирующую нуклеотидную последовательность). В окне Enter Query Sequence вводим последовательность из файла с вырезанной последовательностью, а в окне Database выбираем UniProtKB/Swiss-Prot(swissprot) и нажимаем кнопку BLAST.
Результатом является множество белков, 100% идентичность соответствует белку P30480, данным мне экзоном кодируется участок 208-298 аа. Участок, кодируемый экзоном, является IgC_MHC_I_alpha3 регионом. Белок является HLA class I histocompatibility antigen,B-42 alpha chain.
ID записи | Тип молекулы | Класс данных | Дата внесения в банк | Описание | Длина последовательности |
---|---|---|---|---|---|
X73124 | genomic DNA | std | 02 ноября 1993 | B.subtilis genomic region (325 to 333) | 97015 |
AL009126 | genomic DNA | std | 18 июля 2002 | Bacillus subtilis subsp. subtilis str. 168 complete genome. | 4215606 |