Задание №1. Знакомство со структурой банка EMBL посредством поисковой системы SRS

a)Дата последнего проиндексированного в системе релиза EMBL - 08-09-2011
Количество записей в нём - 71833235

b)

 
Классы          Обозначение                             Число записей, 
                                                  проиндексированных в SRS 
CON:        Constructed sequence                         -
EST:        Expressed Sequence Tag                       -
GRV:        Genome Reviews                               - 
GSS:        Genome Survey Sequence                    	32578894 
HTC:        High Throughput cDNA sequencing             533398   
HTG:        High Throughput Genome sequencing          	145701 
MGA:        Mass Genome Annotation                       -     
PAT:        Patent                                      22346593 
SET:        Project set (EMBL WGS Masters only)          - 
STD:        Standard                                    11737741 
STS:        Sequence Tagged Site                        1322285  
TSA:        Transcriptome Shotgun Assembly              3168623  
WGS:        Whole Genome Shotgun                         -
 

c) Cписок разделов ("Divisions") Банка EMBL:

                                            Число записей в последнем релизе
ENV: Environmental Samples                      	6637887
     (Проба окружающей среды)
FUN: Fungi                                              2219095
     (Грибы)
HUM: Human                                              10687844
     (Человек)
INV: Invertebrates                                      5906093
     (Беспозвоночные)
MAM: Other Mammals                                      5765536
     (Другие млекопитающие)
MUS: Mus musculus                                       4779883
     (Домовая мышь)
PHG: Bacteriophage                                      8082
     (Бактериофаги)
PLN: Plants                                             17132180
     (Растения)
PRO: Prokaryotes                                        1467025
     (Прокариоты)
ROD: Rodents                                            1265394
     (Грызуны)
SYN: Synthetic                                          3632878
     (Синтетические)
TGN: Transgenic                                         265545
     (Трансгенные)
UNC: Unclassified                                       7500493
     (Неклассифицированные)
VRL: Viruses                                            1177936
     (Вирусы)
VRT: Other Vertebrates                                  3387364
     (Другие позвоночные)

Задание №2. Описание гена в записи банка EMBL

Направление гена относительно направления, выбранного для записи - обратное
Число кодирующих участков - 3
Длина :
первого кодирующего участка - 779619-779379+1=241
последнего кодирующего участка - 782591-782354+1=238
Длина:
первого интрона - 780091-779619-1=471
последнего интрона - 782354-780649-1=1704

Задание №3. Нахождение белка по фрагменту гена


1. Использовала программу blastx
2. Выбрала поиск по базе данных swiss prot
Нашелся белок Transcription factor 19. Экзону соответствует участок с 81 остатка по 265 остаток

Задание №4. Ссылки из записи банка Swiss-Prot на записи банка EMBL

Таблица. Записи EMBL, в которых описан ген белка Mana3_Bacsu

ID записи

Тип молекулы

Класс данных

Дата внесения в банк

Описание

Длина последовательности

AL009126

genomic DNA

STD

18-JUL-2002

Bacillus subtilis subsp. subtilis str. 168 complete genome.

4215606

D45048

genomic DNA

STD

23-DEC-1995

Bacillus subtilis orfX, cwlG genes, complete cds.

4162

U02562

genomic DNA

STD

02-MAY-1994

Bacillus subtilis N-acetylglucosaminidase (lytD) gene, complete cds; and unknown gene.

3962

Первая находка - полностью секвенированный геном,в котором содержится ген, кодирующий мой белок вторая - показывает гены cwlG и orfX. А тертья - показывает ген lytD, подвергшийся некоторым изменениям.