ГАВРИШ ОЛЬГА

ФББ - 2 курс - группа 202
Детали

Блок 2: последовательности нуклеиновых кислот.
Практика 1: банк EMBL.

1. Знакомство со структурой банка EMBL посредством поисковой системы SRS.

a) Дата последнего проиндексированного в системе релиза EMBL - 08-09-2011
Количество записей в нём - 71833235

b) Cписок классов ("Data Class") банка EMBL:

Классы Обозначение Число записей, проиндексированных в SRS
CON: Constructed sequence -
EST: Expressed Sequence Tag -
GRV: Genome Reviews -
GSS: Genome Survey Sequence 32578894
HTC: High Throughput cDNA sequencing 533398
HTG: High Throughput Genome sequencing 145701
MGA: Mass Genome Annotation -
PAT: Patent 22346593
SET: Project set (EMBL WGS Masters only) -
STD: Standard 11737741
STS: Sequence Tagged Site 1322285
TSA: Transcriptome Shotgun Assembly 3168623
WGS: Whole Genome Shotgun -

c) Cписок разделов ("Divisions") Банка EMBL:

Классы Обозначение Число записей в последнем релизе
ENV: Environmental Samples
(Проба окружающей среды)
6637887
FUN: Fungi
(Грибы)
2219095
HUM: Human
(Человек)
10687844
INV: Invertebrates
(Беспозвоночные)
5906093
MAM: Other Mammals
(Другие млекопитающие)
5765536
MUS: Mus musculus
(Домовая мышь)
4779883
PHG: Bacteriophage
(Бактериофаги)
8082
PLN: Plants
(Растения)
17132180
PRO: Prokaryotes
(Прокариоты)
1467025
ROD: Rodents
(Грызуны)
1265394
SYN: Synthetic
(Синтетические)
3632878
TGN: Transgenic
(Трансгенные)
265545
UNC: Unclassified
(Неклассифицированные)
7500493
VRL: Viruses
(Вирусы)
1177936
VRT: Other Vertebrates
(Другие позвоночные)
3387364

2. Описание гена в записи банка EMBL.

Ген - FLOT1

Направление гена относительно направления, выбранного для записи - прямое
Число кодирующих участков - 12

Длина первого и последнего кодирующих участков:
первого кодирующего участка - 1200033-1199991+1=43
последнего кодирующего участка - 1214072-1214043+1=30

Длина первого и последнего интронов между кодирующими участками:
первого интрона - 1200313-1200033-1=279
последнего интрона - 1214043-1212166-1=1876

3. Нахождение белка по фрагменту гена.

Самый длинный экзон 1211088..1211269

Файл с самым длинным кодирующим участком - thelongest.fasta.
1. Использовала программу blastx
2. Выбрала поиск по базе данных swiss prot
3. Нашлось...

>sp|O75955.3|FLOT1_HUMAN Gene info linked to O75955.3Genome view with mapviewer linked to O75955.3

RecName: Full=Flotillin-1 Length=427 GENE ID: 10211 FLOT1 | flotillin 1 [Homo sapiens] (Over 10 PubMed links) Score = 65.5 bits (158), Expect = 2e-13 Identities = 33/33 (100%), Positives = 33/33 (100%), Gaps = 0/33 (0%) Frame = +3 Query 81 EQEIARREKELEARVRKPAEAERYKLERLAEAE 179 EQEIARREKELEARVRKPAEAERYKLERLAEAE Sbjct 269 EQEIARREKELEARVRKPAEAERYKLERLAEAE 301


4. Ссылки из записи банка Swiss-Prot на записи банка EMBL.

ID записи Тип молекулы Класс данных Дата внесения в банк Описание Длина последовательности
X70356 genomic DNA STD 07-AUG-1993 B.subtilis srfA-sfp gene region for surfactin synthetase 32802
D50453 genomic DNA STD 01-FEB-1997 Bacillus subtilis DNA, 25-36 degree region 1461912
AL009126 genomic DNA STD 18-JUL-2002 Bacillus subtilis subsp. subtilis str. 168 complete genome 4215606
Последняя находка показывает полностью отсеквенироваанный геном, первая - участок гена srfA-sfp.


© by OlGavrish, 2011