Задание №1. Знакомство со структурой банка EMBL посредством поисковой системы SRS
a)Дата последнего проиндексированного в системе релиза EMBL - 08-09-2011
Количество записей в нём - 71833235
b)
Классы Обозначение Число записей,
проиндексированных в SRS
CON: Constructed sequence -
EST: Expressed Sequence Tag -
GRV: Genome Reviews -
GSS: Genome Survey Sequence 32578894
HTC: High Throughput cDNA sequencing 533398
HTG: High Throughput Genome sequencing 145701
MGA: Mass Genome Annotation -
PAT: Patent 22346593
SET: Project set (EMBL WGS Masters only) -
STD: Standard 11737741
STS: Sequence Tagged Site 1322285
TSA: Transcriptome Shotgun Assembly 3168623
WGS: Whole Genome Shotgun -
c)
Cписок разделов ("Divisions") Банка EMBL:
Число записей в последнем релизе
ENV: Environmental Samples 6637887
(Проба окружающей среды)
FUN: Fungi 2219095
(Грибы)
HUM: Human 10687844
(Человек)
INV: Invertebrates 5906093
(Беспозвоночные)
MAM: Other Mammals 5765536
(Другие млекопитающие)
MUS: Mus musculus 4779883
(Домовая мышь)
PHG: Bacteriophage 8082
(Бактериофаги)
PLN: Plants 17132180
(Растения)
PRO: Prokaryotes 1467025
(Прокариоты)
ROD: Rodents 1265394
(Грызуны)
SYN: Synthetic 3632878
(Синтетические)
TGN: Transgenic 265545
(Трансгенные)
UNC: Unclassified 7500493
(Неклассифицированные)
VRL: Viruses 1177936
(Вирусы)
VRT: Other Vertebrates 3387364
(Другие позвоночные)
Задание №2. Описание гена в записи банка EMBL
Направление гена относительно направления, выбранного для записи - обратное
Число кодирующих участков - 3
Длина :
первого кодирующего участка - 779619-779379+1=241
последнего кодирующего участка - 782591-782354+1=238
Длина:
первого интрона - 780091-779619-1=471
последнего интрона - 782354-780649-1=1704
Задание №3. Нахождение белка по фрагменту гена
1. Использовала программу blastx
2. Выбрала поиск по базе данных swiss prot
Нашелся белок Transcription factor 19. Экзону соответствует участок с 81 остатка по 265 остаток
Задание №4. Ссылки из записи банка Swiss-Prot на записи банка EMBL
Таблица. Записи EMBL, в которых описан ген белка Mana3_Bacsu
ID записи |
Тип молекулы |
Класс данных |
Дата внесения в банк |
Описание |
Длина последовательности |
AL009126 |
genomic DNA |
STD |
18-JUL-2002 |
Bacillus subtilis subsp. subtilis str. 168 complete genome. |
4215606 |
D45048 |
genomic DNA |
STD |
23-DEC-1995 |
Bacillus subtilis orfX, cwlG genes, complete cds. |
4162 |
U02562 |
genomic DNA |
STD |
02-MAY-1994 |
Bacillus subtilis N-acetylglucosaminidase (lytD) gene, complete cds; and unknown gene. |
3962 |
Первая находка - полностью секвенированный геном,в котором содержится ген, кодирующий мой белок вторая - показывает гены cwlG и orfX. А тертья - показывает ген lytD, подвергшийся некоторым изменениям.
