1. Знакомство со структурой банка EMBL помредством поисковой системы SRS
a)Последний проиндексированный в системе релиз EMBL
был 8 Сентября 2011 года.Количество записей - 71833235
b)Список классов банка EMBL и Число записей каждого класса, проиндексиованных SRS для последнего релиза EMBL:
CON: Constructed sequence
EST: Expressed Sequence Tag
GRV: Genome Reviews
GSS: Genome Survey Sequence 2578894
HTC: High Throughput cDNA sequencing 533398
HTG: High Throughput Genome sequencing 145701
MGA: Mass Genome Annotation
PAT: Patent 22346593
SET: Project set (EMBL WGS Masters only)
STD: Standard 11737741
STS: Sequence Tagged Site 1322285
TSA: Transcriptome Shotgun Assembly 3168623
WGS: Whole Genome Shotgun
c)Список разделов банка EMBL и число записей в последнем релизе:
ENV: Environmental Samples (Образцы из среды) 6697887
FUN: Fungi (Грибы) 2219095
HUM: Human (Человек) 10687844
INV: Invertebrates (Беспозвоночные) 5906093
MAM: Other Mammals (Прочие млекопитающие) 5765539
MUS: Mus musculus (Мышь домовая) 4779883
PHG: Bacteriophage (Бактериофаги) 8082
PLN: Plants (Растения) 17132180
PRO: Prokaryotes (Прокариоты) 1467025
ROD: Rodents (Грызуны) 1265394
SYN: Synthetic (Синтетические) 3632878
TGN: Transgenic (Трансгенные) 265545
UNC: Unclassified (Неклассифицированные) 7500493
VRL: Viruses (Вирусы) 1177936
VRT: Other Vertebrates (Другие позвоночные) 3381364
2. Описание гена записи банка EMBL
Ген MICA
Направление гена относительно направления, выбранного для записи: Обратное
Число Кодирующих участков: 5
Длина первого кодирующего участка: 70
Длина Последнего кодирующего участка 107
Длина первого интрона 6840
Длина последнего интрона 99
3. Нахождение белка по фрагменту гена
1. На странице http://blast.ncbi.nlm.nih.gov/ выбрать программу blsctx2. Скопировать интересующую последовательность в поле "Enter accession number(s), gi(s), or FASTA sequence(s)"
3. Выбрать нужный генетический код в поле "Genetic code"
4. Проверить, чтобы была выбрана база данных "Swissprot protein sequences(swissprot)"
5. Нажать кнопку BLAST
Лучшая находка - Q29983.1 с E-value = 7e-61 и идентиностью в 97%, соответствует участку белка с 110 - 204 а.о.
4.Ссылки из записи банка Swiss-Prot на записи банка EMBL
ID записи | Тип молекулы | Класс данных | Дата внесения в банк | Описание | Длина последовательности |
Z68500 | linear genomic DNA | STD | 12-JAN-1996 | B.subtilis cwlC, nrdE, nrdF, ymaA and ymaB genes | 5559 |
AL009126 | circular genomic DNA | STD | 18-JUL-2002 | Bacillus subtilis subsp. subtilis str. 168 complete genome. | 4215606 |