Задание №1. Знакомство со структурой банка EMBL посредством поисковой системы SRS
a)Дата последнего проиндексированного в системе релиза EMBL - 08-09-2011
Количество записей в нём - 71833235
b)
Классы Обозначение Число записей, проиндексированных в SRS CON: Constructed sequence - EST: Expressed Sequence Tag - GRV: Genome Reviews - GSS: Genome Survey Sequence 32578894 HTC: High Throughput cDNA sequencing 533398 HTG: High Throughput Genome sequencing 145701 MGA: Mass Genome Annotation - PAT: Patent 22346593 SET: Project set (EMBL WGS Masters only) - STD: Standard 11737741 STS: Sequence Tagged Site 1322285 TSA: Transcriptome Shotgun Assembly 3168623 WGS: Whole Genome Shotgun -
c)
Cписок разделов ("Divisions") Банка EMBL:
Число записей в последнем релизе ENV: Environmental Samples 6637887 (Проба окружающей среды) FUN: Fungi 2219095 (Грибы) HUM: Human 10687844 (Человек) INV: Invertebrates 5906093 (Беспозвоночные) MAM: Other Mammals 5765536 (Другие млекопитающие) MUS: Mus musculus 4779883 (Домовая мышь) PHG: Bacteriophage 8082 (Бактериофаги) PLN: Plants 17132180 (Растения) PRO: Prokaryotes 1467025 (Прокариоты) ROD: Rodents 1265394 (Грызуны) SYN: Synthetic 3632878 (Синтетические) TGN: Transgenic 265545 (Трансгенные) UNC: Unclassified 7500493 (Неклассифицированные) VRL: Viruses 1177936 (Вирусы) VRT: Other Vertebrates 3387364 (Другие позвоночные)
Задание №2. Описание гена в записи банка EMBL
Направление гена относительно направления, выбранного для записи - обратное
Число кодирующих участков - 3
Длина :
первого кодирующего участка - 779619-779379+1=241
последнего кодирующего участка - 782591-782354+1=238
Длина:
первого интрона - 780091-779619-1=471
последнего интрона - 782354-780649-1=1704
Задание №3. Нахождение белка по фрагменту гена
1. Использовала программу blastx
2. Выбрала поиск по базе данных swiss prot
Нашелся белок Transcription factor 19. Экзону соответствует участок с 81 остатка по 265 остаток
Задание №4. Ссылки из записи банка Swiss-Prot на записи банка EMBL
Таблица. Записи EMBL, в которых описан ген белка Mana3_Bacsu
ID записи |
Тип молекулы |
Класс данных |
Дата внесения в банк |
Описание |
Длина последовательности |
AL009126 |
genomic DNA |
STD |
18-JUL-2002 |
Bacillus subtilis subsp. subtilis str. 168 complete genome. |
4215606 |
D45048 |
genomic DNA |
STD |
23-DEC-1995 |
Bacillus subtilis orfX, cwlG genes, complete cds. |
4162 |
U02562 |
genomic DNA |
STD |
02-MAY-1994 |
Bacillus subtilis N-acetylglucosaminidase (lytD) gene, complete cds; and unknown gene. |
3962 |
Первая находка - полностью секвенированный геном,в котором содержится ген, кодирующий мой белок вторая - показывает гены cwlG и orfX. А тертья - показывает ген lytD, подвергшийся некоторым изменениям.
