№1 Знакомство со структурой банка EMBL посредством поисковой системы SRS
"Пункт a"
The current release (113) has 82772678 entries and was indexed 18-Sep-2012. - значит, что текущий релиз был проиндексирован последний раз 18 сентября этого года.
"Пункт b"
CON | Constructed sequence |
EST | Expressed Sequence Tag |
GRV | Genome Reviews |
GSS | Genome Survey Sequence |
HTC | High Throughput cDNA sequencing |
HTG | High Throughput Genome sequencing |
MGA | Mass Genome Annotation |
PAT | Patent |
SET | Project set (EMBL WGS Masters only) |
STD | Standard |
STS | Sequence Tagged Site |
TSA | Transcriptome Shotgun Assembly |
WGS | Whole Genome Shotgun |
Число записей каждого класса, проиндексированных SRS для последнего релиза EMBL. В SRS не проиндексированы CON, EST, GRV, MGA, SET, WGS
GSS | 34528104 |
HTC | 491770 |
HTG | 152599 |
PAT | 24364832 |
STD | 13920617 |
STS | 1322570 |
TSA | 7992186 |
"Пункт c"
ENV | Образцы из окружающей среды = 7762556 |
FUN | Грибы = 2402829 |
HUM | Человек = 11304977 |
INV | Беспозвоночные = 7398340 |
MAM | Остальные млекопитающие = 6741732 |
MUS | Домовая мышь = 5163724 |
PHG | Бактериофаги = 8503 |
PLN | Растения = 20284404 |
PRO | Прокариоты = 1639517 |
ROD | Грызуны = 1313761 |
SYN | Синтетические (искусственные) = 4045013 |
TGN | Трансгенные = 285306 |
UNC | Неклассифицированные = 8617170 |
VRL | Вирусы = 1358516 |
VRT | Другие позвоночные = 4446330 |
"Пункт d"
Были выбраны группы MAM, VRT, PRO. Результаты приведены на диаграмме, на которой видно, что число стандартных записей ощутимо выросло у позвоночных, почти не изменилось у MAM, почти в два раза выросло у прокариот.
№2 Описание гена в записи банка EMBL
№3 Нахождение белка по фрагменту гена
Был выбран самый длинный кодирующий участок 328665-328689 - 163 нуклеотида.Переходим в http://blast.ncbi.nlm.nih.gov/:
В итоге получилось 2 стопроцентных результата. Один белок Allograft inflammatory factor 1, с двумя AC - P55008.1 и Q5TM25.1. Это соответствует тому, что было в EMBEL "UniProtKB/Swiss-Prot:P55008". Экзон кодирует аминокислоты 67-119 в данном белке.
№4 Ссылки из записи банка Swiss-Prot на записи банка EMBL
Все ссылки на банк EMBL, описывающей мой (O31465) белок, в записи Swiss-Prot.DR EMBL; AB006424; BAA33141.1; -; Genomic_DNA.
DR EMBL; AL009126; CAB12037.1; -; Genomic_DNA.
Записи EMBL, в которых описан ген моего белка
ID записи | Тип молекулы | Класс данных | Дата внесения в банк | Описание | Длина последовательности |
EMBL:AB006424 AB006424 | genomic DNA | STD | 23-SEP-1998 | Bacillus subtilis genomic DNA, 70 kb region between 17 and 23 degree. | 69650 |
EMBL:AL009126 AL009126 | genomic DNA | STD | 18-JUL-2002 | Bacillus subtilis subsp. subtilis str. 168 complete genome. | 4215606 |