- Знакомство со структурой банка EMBL посредством поисковой системы SRS
Последний (109) релиз содержит 71833235 записей и был проиндексирован 08 сентября 2011 года.
Разные классы данных в банке EMBL обозначены трехбуквенным кодом. Для проиндексированных в скобках указанны количества записей.
CON: Constructed sequence EST: Expressed Sequence Tag GRV: Genome Reviews GSS: Genome Survey Sequence (32578894) HTC: High Throughput cDNA sequencing (533398) HTG: High Throughput Genome sequencing (145701) MGA: Mass Genome Annotation PAT: Patent (22346593) SET: Project set (EMBL WGS Masters only) STD: Standard (11737741) STS: Sequence Tagged Site (1322285) TSA: Transcriptome Shotgun Assembly (3168623) WGS: Whole Genome Shotgun
Разделы в банке данных EMBL
ENV: Environmental Samples - Образцы из среды 6637887 FUN: Fungi - Грибы 2219095 HUM: Human - Человек 10687844 INV: Invertebrates - Беспозвоночные 5906093 MAM: Other Mammals - Прочие млекопитающие 5765536 MUS: Mus musculus - Мышь домовая 4779883 PHG: Bacteriophage - Бактериофаги 8082 PLN: Plants - Растения 17132180 PRO: Prokaryotes - Прокариоты 1467025 ROD: Rodents - Грызуны 1265394 SYN: Synthetic - Синтетические 3632878 TGN: Transgenic - Трансгенные 265545 UNC: Unclassified - Неклассифицированные 7500493 VRL: Viruses - Вирусы 1177936 VRT: Other Vertebrates - Прочие позвоночные 3387364
Количество поступлений в банк EMBL в 2010 и 2011 годах.
В 2011 году поступило значительно больше метагеномов из среды, геномов трансгенных организмов и беспозвоночных, однако, количество записей, относящихся к человеку, снизилось.
- Описание гена в записи банка EMBL
Ген MicE.
Направление гена относительно направления, выбранного для записи - прямое.
Число кодирующих участков: 6.
Длины первого и последнего кодирующих участков: 75 и 303 соответственно.
Длины первого и последнего интронов между кодирующими участками: 252 и 2153 соответственно.
FT CDS join(2191157..2191231,2194405..2194659,2194898..2195182, FT 2195588..2195865,2195980..2196123,2198277..2198579) FT /pseudo FT /gene="MICE" FT /note="MICA/B homologous" FT /note="alternative name: PERB11.5" FT exon 2191157..2191231 FT /pseudo FT /gene="MICE" FT /number=1 FT CDS complement(2191484..2191880) FT /pseudo FT /gene="HCGIX-5" FT /note="HCG family" FT exon 2191484..2191880 FT /pseudo FT /gene="HCGIX-5" FT /number=1 FT exon 2194405..2194659 FT /gene="MICE" FT /number=2 FT exon 2194898..2195182 FT /gene="MICE" FT /number=3 FT exon 2195588..2195865 FT /gene="MICE" FT /number=4 FT exon 2195980..2196123 FT /gene="MICE" FT /number=5 FT exon 2198277..2198579 FT /gene="MICE" FT /number=6
- Нахождение белка по фрагменту гена
Инструкция к поиску:
На сайте http://blast.ncbi.nlm.nih.gov/ выбрать программу blastx, вырезанный программой seqret участок можно скопировать в окошко или загрузить, не забыть в поле "database" выбрать "Swissprot".
В ходе поиска белок MicE не был обнаружен, но были найдены белки MicB и MicA, гомологичные ему.
Для белка MicB (первый по е-value) был обнаружен участок из 28 аминокислотных остатков, идентичный на 71% части транслировнанного экзона MicE (экзон 6, 303 пары оснований.)
В белке MicB он занимает позицию с 344 по 371 а.о.
- Ссылки из записи банка Swiss-Prot на записи банка EMBL
В банке представлены записи, содержащие искомый ген(1993 год), участок бактериальной хромосомы, где он расположен,(1995) и полный геном B subtilis(2002)