1. Знакомство со структурой банка EMBL помредством поисковой системы SRS



a)Последний проиндексированный в системе релиз EMBL

был 8 Сентября 2011 года.
Количество записей - 71833235

b)Список классов банка EMBL и Число записей каждого класса, проиндексиованных SRS для последнего релиза EMBL:


CON: Constructed sequence
EST: Expressed Sequence Tag
GRV: Genome Reviews
GSS: Genome Survey Sequence 2578894
HTC: High Throughput cDNA sequencing 533398
HTG: High Throughput Genome sequencing 145701
MGA: Mass Genome Annotation
PAT: Patent 22346593
SET: Project set (EMBL WGS Masters only)
STD: Standard 11737741
STS: Sequence Tagged Site 1322285
TSA: Transcriptome Shotgun Assembly 3168623
WGS: Whole Genome Shotgun

c)Список разделов банка EMBL и число записей в последнем релизе:


ENV: Environmental Samples (Образцы из среды) 6697887
FUN: Fungi (Грибы) 2219095
HUM: Human (Человек) 10687844
INV: Invertebrates (Беспозвоночные) 5906093
MAM: Other Mammals (Прочие млекопитающие) 5765539
MUS: Mus musculus (Мышь домовая) 4779883
PHG: Bacteriophage (Бактериофаги) 8082
PLN: Plants (Растения) 17132180
PRO: Prokaryotes (Прокариоты) 1467025
ROD: Rodents (Грызуны) 1265394
SYN: Synthetic (Синтетические) 3632878
TGN: Transgenic (Трансгенные) 265545
UNC: Unclassified (Неклассифицированные) 7500493
VRL: Viruses (Вирусы) 1177936
VRT: Other Vertebrates (Другие позвоночные) 3381364

2. Описание гена записи банка EMBL



Ген MICA

Направление гена относительно направления, выбранного для записи: Обратное

Число Кодирующих участков: 5

Длина первого кодирующего участка: 70

Длина Последнего кодирующего участка 107

Длина первого интрона 6840

Длина последнего интрона 99

3. Нахождение белка по фрагменту гена

1. На странице http://blast.ncbi.nlm.nih.gov/ выбрать программу blsctx
2. Скопировать интересующую последовательность в поле "Enter accession number(s), gi(s), or FASTA sequence(s)"
3. Выбрать нужный генетический код в поле "Genetic code"
4. Проверить, чтобы была выбрана база данных "Swissprot protein sequences(swissprot)"
5. Нажать кнопку BLAST

Лучшая находка - Q29983.1 с E-value = 7e-61 и идентиностью в 97%, соответствует участку белка с 110 - 204 а.о.

4.Ссылки из записи банка Swiss-Prot на записи банка EMBL


ID записи Тип молекулы Класс данных Дата внесения в банк Описание Длина последовательности
Z68500 linear genomic DNA STD 12-JAN-1996 B.subtilis cwlC, nrdE, nrdF, ymaA and ymaB genes 5559
AL009126 circular genomic DNA STD 18-JUL-2002 Bacillus subtilis subsp. subtilis str. 168 complete genome. 4215606