EMBL


На главную Назад
1.EMBL
Последнее индексирование (110) произошло 14 дек. 2011 (по состоянию на 16 дек 2011).
Количество записей релиза сотавило 74582226.
a) Описание раздела "Data classes":
CON: Constructed sequence -не проиндексирован
EST: Expressed Sequence Tag -не проиндексирован
GRV: Genome Reviews -не проиндексирован
GSS: Genome Survey Sequence -32873764 записи
HTC: High Throughput cDNA sequencing -535335 записей
HTG: High Throughput Genome sequencing -146380 записей
MGA: Mass Genome Annotation -не проиндексирован
PAT: Patent -23118147 записей
SET: Project set (EMBL WGS Masters only) -не проиндексирован
STD: Standard -12239138 записей
STS: Sequence Tagged Site -1322455 записей
TSA: Transcriptome Shotgun Assembly -4347007 записей
WGS: Whole Genome Shotgun -не проиндексирован
b) Описание раздела "Divisions":
ENV: Environmental Samples Природные представители 6825856 записей
FUN: Fungi Грибы 2242759 записей
HUM: Human Человек 11097253 записи
INV: Invertebrates Беспозвоночные 6221687 записей
MAM: Other Mammals Другие млекопитающие 6074350 записей
MUS: Mus musculus Мышь 4783826 записей
PHG: Bacteriophage Бактериофаги 8228 записей
PLN: Plants Растения 18013459 записей
PRO: Prokaryotes Прокариоты 1494083 записи
ROD: Rodents Грызуны 1299990 записей
SYN: Synthetic Синтетические 3798387 записей
TGN: Transgenic Трансгенные 285281 записи
UNC: Unclassified Неклассифицированные 7673923 записи
VRL: Viruses Вирусы 1227535 записей
VRT: Other Vertebrates Другие позвоночные 3535609 записей

2.Описание гена HLA-C:
Направление гена относительно направления записи - прямое. Содержит 8 кодирующих участков (экзонов), длинна первого участка - 73 п.о., послетнего (т.е. восьмого) - 5 п.о.
Длинна первого интрона - 130 п.о., последнего - 164. Ниже приведён фрагмент записи моего гена.
FT   misc_feature    670925..674759
FT                   /gene="HLA-C"
FT                   /note="match HLA-C (D83957) with account of intervene
FT                   sequences."
FT   CDS             join(671525..671597,671728..671997,672248..672523,
FT                   673111..673386,673511..673630,674071..674103,
FT                   674211..674258,674423..674427)
FT                   /codon_start=1
FT                   /transl_table=1
FT                   /gene="HLA-C"
FT                   /note="Classical HLA Class I gene"
FT                   /db_xref="GOA:O19617"
FT                   /db_xref="HSSP:1M05"
FT                   /db_xref="InterPro:IPR013783"
FT                   /db_xref="UniProtKB/TrEMBL:O19617"
FT                   /protein_id="BAB63310.1"
FT                   /translation="MRVMAPRALLLLLSGGLALTETWACSHSMRYFDTAVSRPGRGEPR
FT                   FISVGYVDDTQFVRFDSDAASPRGEPRAPWVEQEGPEYWDRETQNYKRQAQADRVSLRN
FT                   LRGYYNQSEDGSHTLQRMYGCDLGPDGRLLRGYDQSAYDGKDYIALNEDLRSWTAADTA
FT                   AQITQRKLEAARAAEQLRAYLEGTCVEWLRRYLENGKETLQRAEPPKTHVTHHPLSDHE
FT                   ATLRCWALGFYPAEITLTWQRDGEDQTQDTELVETRPAGDGTFQKWAAVVVPSGQEQRY
FT                   TCHMQHEGLQEPLTLSWEPSSQPTIPIMGIVAGLAVLVVLAVLGAVVTAMMCRRKSSGG
FT                   KGGSCSQAACSNSAQGSDESLITCKA"
FT   exon            671525..671597
FT                   /gene="HLA-C"
FT                   /number=1
FT   exon            671728..671997
FT                   /gene="HLA-C"
FT                   /number=2
FT   exon            672248..672523
FT                   /gene="HLA-C"
FT                   /number=3
FT   exon            673111..673386
FT                   /gene="HLA-C"
FT                   /number=4
FT   exon            673511..673630
FT                   /gene="HLA-C"
FT                   /number=5
FT   exon            674071..674103
FT                   /gene="HLA-C"
FT                   /number=6
FT   exon            674211..674258
FT                   /gene="HLA-C"
FT                   /number=7
FT   exon            674423..674459
FT                   /gene="HLA-C"
FT                   /number=8

3.Нахождение белка по фрагменту:
Спомощью команды -seqret embl:BA00025 -sask вырезали самый длинный кодирующий участок гена HLA-C,
начинающегося с 673111 и заканчивающегося на 673386 позиции. (ba000025.fasta). Полученную последовательность ввели в окошко
поля "Enter Query Sequence" программы blastx (поиск белковых последовательностей, используя транслируемые нуклеотидные последовательности).
Поиск проводили в базе данных SwissProt, для чего в окошке "Database" поля "Choose Search Set" выбрали соответствующую б.д.
Врезультате был найден белок 1C07_HUMAN, (AC - P10321),соответствующий выбранному экзону, соответствующий участок 208 - 298 а.о.
4.Ссылки из записи банка Swiss-Prot на записи EMBL:

Ссыдки на EMBL в записи SwissProt для белка PYRC_ECOLI
DR   EMBL; X04469; CAA28157.1; -; Genomic_DNA.
DR   EMBL; M16752; AAA24482.1; -; Genomic_DNA.
DR   EMBL; U00096; AAC74146.1; -; Genomic_DNA.
DR   EMBL; AP009048; BAA35870.1; -; Genomic_DNA.
DR   EMBL; D31709; BAA06514.1; -; Genomic_DNA.


Врезультате поиска были получены 5 записией:
EMBL ID Molecule Class SeqLength DateCreated Description
  EMBL:U00096 U00096
genomic DNA
STD
4639675
23-FEB-2006
Escherichia coli str. K-12 substr. MG1655, complete genome.
  EMBL:AP009048 AP009048
genomic DNA
STD
4646332
22-JAN-2006
Escherichia coli str. K12 substr. W3110 DNA, complete genome.
  EMBL:D31709 D31709
genomic DNA
STD
3842
28-MAR-1996
Escherichia coli dinI and solA genes for DinI and SolA, complete cds.
  EMBL:M16752 M16752
genomic DNA
STD
1629
02-APR-1988
E.coli K-12 pyrC gene encoding dihydroorotase, complete cds.
  EMBL:X04469 X04469
genomic DNA
STD
2046
07-JUN-1987
E. coli pyrC gene for dihydroorotase

Записи относятся к орагнизму Escherichia coli, дата создания первой записи соответствует расшифровке гена PyrC, кодирующим фермент dihydroorotase, т.е. мой белок.
23 февраль 2006 - полный геном штамма К-12.

©Базылев Сергей, 2007