Занятие 5. Банк EMBL




Банк EMBL

1. Знакомство со структурой банка EMBL посредством поисковой системы SRS

Последний проиндексированный 08-сентября-2011 в системе релиз (109) EMBL имеет 71833235 записей.

Cписок классов ("Data Class") банка EMBL
Values in EMBLRELEASE
Класс Число записей

CON: Constructed sequence

 

EST: Expressed Sequence Tag

 

GRV: Genome Reviews

 

GSS: Genome Survey Sequence

32578894

HTC: High Throughput cDNA sequencing

533398

HTG: High Throughput Genome sequencing

145701

MGA: Mass Genome Annotation

 

PAT: Patent

22346593

SET: Project set (EMBL WGS Masters only)

 

STD: Standard

11737741

STS: Sequence Tagged Site

1322285

TSA: Transcriptome Shotgun Assembly

3168623

WGS: Whole Genome Shotgun

 


Записи следующих классов не проиндексированы в SRS: CON, EST, GRV, MGA, SET, WGS.

Cписок разделов ("Divisions") банка EMBL
Values in EMBLRELEASE
Класс Русское название Число записей

ENV: Environmental Samples

Образцы среды

6637887

FUN: Fungi

Грибы

2219095

HUM: Human

Человек

10687844

INV: Invertebrates

Беспозвоночные

5906093

MAM: Other Mammals

Другие млекопитающие

5765536

MUS: Mus musculus

Мышь домовая

4779883

PHG: Bacteriophage

Бактериофаги

8082

PLN: Plants

Растения

17132180

PRO: Prokaryotes

Прокариоты

1467025

ROD: Rodents

Грызуны

1265394

SYN: Synthetic

Синтетические последовательности

3632878

TGN: Transgenic

Трансгенные последовательности

265545

UNC: Unclassified

Неклассифицированные

7500493

VRL: Viruses

Вирусы

1177936

VRT: Other Vertebrates

Другие позвоночные

3387364


2. Описание гена APOM в записи банка EMBL

Hаправление гена относительно направления, выбранного для записи, обратное
Число кодирующих участков: 6
Длины первого и последнего кодирующих участков соответсвенно равны 114 и 26
Длины первого и последнего интронов между кодирующими участками соответственно равны 391 и 340

3. Нахождение белка по фрагменту гена

Cамый длинный кодирующий участок 287402..287556 (длиной 154) подаем программе blastx на странице http://blast.ncbi.nlm.nih.gov/ и находим в Swiss-Prot соответствующий белок
В результате поиска был найден белок O95445.2, участок 39-89 которого соответствует моему экзону 000000000000000

4. Ссылки из записи банка Swiss-Prot на записи банка EMBL

Таблица. Записи EMBL, в которых описан ген белка PTHP_BACSU
GEN OF PTHP_BACSU in EMBL
ID записи Тип молекулы Класс данных Дата внесения в банк Описание Длина последовательности

X12832

genomic DNA

STD

04-OCT-1988

Bacillus subtilis ptsX, ptsH and ptsI genes for enzyme III-glucose (EC 2.7.1.69), Hpr protein and enzyme I (EC 2.7.3.9) of PEP:sugar phosphtransferase system

1,689

AL009126

genomic DNA

STD

18-JUL-2002

Bacillus subtilis subsp. subtilis str. 168 complete genome

4,215,606


Следует отметить, что для записей CAA31317.1 и CAB13263.1 не указаны даты внесения в банк, а длины их последовательностей одинаковы и значительно меньше по сравнению с записями X12832.1 и AL009126.3. Для всех записей характерен один и тот же тип молекул - genomic DNA и класс данных - STD.


©Андреянова Екатерина