Банк EMBL

Главная

1. Знакомство со структурой банка EMBL посредством поисковой системы SRS


При выполнении упражнения пользовалась SRS на сайте EBI.

a.


С "Library Page" последовада по гиперссылке "EMBL (release)".
18 сентября 2012 - дата последнего проиндексированного в системе релиза EMBL. В нем 82772678 записей.

b.

Список классов ("Data Class") банка EMBL:
CON: Constructed sequence
EST: Expressed Sequence Tag
GRV: Genome Reviews
GSS: Genome Survey Sequence (34528104 записей)
HTC: High Throughput cDNA sequencing (491770 записей)
HTG: High Throughput Genome sequencing (152599 записей)
MGA: Mass Genome Annotation
PAT: Patent (24364832 записей)
SET: Project set (EMBL WGS Masters only)
STD: Standard (13920617 записей)
STS: Sequence Tagged Site (1322570 записей)
TSA: Transcriptome Shotgun Assembly (7992186 записей)
WGS: Whole Genome Shotgun

c.

Cписок разделов ("Divisions") банка EMBL:

Обозначение Описание Число записей в последнем релизе

ENV

Environmental Samples(Образцы окружающей среды) 7762556

FUN

Fungi (Грибы) 2402829

HUM

Human(Люди) 11304977

INV

Invertebrates(Беспозвоночные) 7398340

MAM

Other Mammals (Другие млекопитающие) 6741732

MUS

Mus musculus (Мыши) 5163724

PHG

Bacteriophage (Бактериофаги) 8503

PLN

Plants (Растения) 20284404

PRO

Prokaryotes(Прокариоты) 1639517

ROD

Rodents(Грызуны) 1313761

SYN

Synthetic(Синтетические продукты) 4045013

TGN

Transgenic(Трангенные организмы) 285306

UNC

Unclassified (Неклассифицированные) 8617170

VRL

Viruses (Вирусы) 1358516

VRT

Other Vertebrates(Другие позвоночные) 4446330

2. Описание гена MICA в записи банка EMBL


Обратное направление гена.
5 кодирующих участков.
Длина первого кодирующего участка - 70.
Длина последнего кодирующего участка - 107.
Длина первого интрона - 245.
Длина последнего интрона - 99.

FT   exon            531684..531819
FT                   /gene="MICA"
FT                   /number=5
FT   CDS             complement(join(531713..531819,531919..532197,
FT                   532785..533072,533347..533601,540442..540511))
FT                   /codon_start=1
FT                   /transl_table=1
FT                   /gene="MICA"
FT                   /product="Stress inducible class I homolog"
FT                   /function="gamma delta-TCR and NKG2D ligand"
FT                   /note="alternative name: PERB11.1"
FT                   /db_xref="GOA:Q96QC4"
FT                   /db_xref="HSSP:1B3J"
FT                   /db_xref="InterPro:IPR013783"
FT                   /db_xref="UniProtKB/TrEMBL:Q96QC4"
FT                   /protein_id="BAB63308.1"
FT                   /translation="MGLGPVFLLLAGIFPFAPPGAAAEPHSLRYNLTVLSWDGSVQSGF
FT                   LAEVHLDGQPFLRYDRQKCRAKPQGQWAEDVLGNKTWDRETRDLTGNGKDLRMTLAHIK
FT                   DQKEGLHSLQEIRVCEIHEDNSTRSSQHFYYDGELFLSQNLETEEWTVPQSSRAQTLAM
FT                   NVRNFLKEDAMKTKTHYHAMHADCLQELRRYLESGVVLRRTVPPMVNVTRSEASEGNIT
FT                   VTCRASSFYPRNIILTWRQDGVSLSHDTQQWGDVLPDGNGTYQTWVATRICRGEEQRFT
FT                   CYMEHSGNHSTHPVPSGKVLVLQSHWQTFHVSAVAAGCCYFCYYYFLCPLL"
FT   exon            531919..532197
FT                   /gene="MICA"
FT                   /number=4
FT   exon            532785..533072
FT                   /gene="MICA"
FT                   /number=3
FT   exon            533347..533601
FT                   /gene="MICA"
FT                   /number=2
FT   CDS             539787..540196
FT                   /pseudo
FT                   /gene="HCGIX-2"
FT                   /note="HCG family"
FT   exon            539787..540196
FT                   /pseudo
FT                   /gene="HCGIX-2"
FT                   /number=1
FT   exon            540442..540550
FT                   /gene="MICA"

3.Нахождение белка по фрагменту гена


Вырезала самый длинный кодирующий участок(532785-533072) в отдельный файл.
Воспользовалась программой seqret с опцией -sask.
Зашла на страницу http://blast.ncbi.nlm.nih.gov.
Выбрала blastX. Загрузила файл mica.fasta.
Выбрала банк Swiss-Prot в поле database.
Нашелся белок Q29983.1|MICA_HUMAN
Участок этого белка(3-287) соответствует экзону.

4. Ссылки из записи банка Swiss-Prot на записи банка EMBL


В записи Swiss-Prot, описывающей мой белок(DACC_BACSU), нашла все ссылки на банк EMBL:
DR EMBL; Z34883; CAA84366.1; -; Genomic_DNA.
DR EMBL; AL009126; CAB13718.1; -; Genomic_DNA.
Запись Swiss-Prot получила программой entret:
entret sw:dacc_bacsu
Записала в dacc.txt в /Term3/Block2/Practice1.
Воспользовалась SRS для заполнения таблицы.

Записи EMBL, в которых описан ген белка DACC_BACSU:

ID записи

Тип молекулы

Класс данных

Дата внесения в банк

Описание

Длина последовательности

AL009126 genomic DNA STD 18-JUL-2002 Bacillus subtilis subsp. subtilis str. 168 complete genome. 4215606
Z34883 genomic DNA STD 01-JUL-1994 B.subtilis genes for peptide synthetase and penicillin binding protein 39822

©Eliseeva Julia