УЧЕБНЫЙ САЙТ АМОСОВОЙ АЛЁНЫ

Структура банка RefSeq и поисковая система SRS

С помощью поиска SRS требовалось вывести список хромосом дрожжей Saccharomyces cerevisiae и вставить его в отчёт как преформатированный текст. Результат можно увидеть ниже:

 REFSEQ_DNA:NC_001133	NC_001133	Saccharomyces cerevisiae S288c chromosome I, complete sequence. 	230218	
REFSEQ_DNA:NC_001134	NC_001134	Saccharomyces cerevisiae S288c chromosome II, complete sequence. 	813184	
REFSEQ_DNA:NC_001135	NC_001135	Saccharomyces cerevisiae S288c chromosome III, complete sequence. 	316620	
REFSEQ_DNA:NC_001136	NC_001136	Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 	1531933	
REFSEQ_DNA:NC_001137	NC_001137	Saccharomyces cerevisiae S288c chromosome V, complete sequence. 	576874	
REFSEQ_DNA:NC_001138	NC_001138	Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 	270161	
REFSEQ_DNA:NC_001139	NC_001139	Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 	1090940	
REFSEQ_DNA:NC_001140	NC_001140	Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 	562643	
REFSEQ_DNA:NC_001141	NC_001141	Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 	439888	
REFSEQ_DNA:NC_001142	NC_001142	Saccharomyces cerevisiae S288c chromosome X, complete sequence. 	745751	
REFSEQ_DNA:NC_001143	NC_001143	Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 	666816	
REFSEQ_DNA:NC_001144	NC_001144	Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 	1078177	
REFSEQ_DNA:NC_001145	NC_001145	Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 	924431	
REFSEQ_DNA:NC_001146	NC_001146	Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 	784333	
REFSEQ_DNA:NC_001147	NC_001147	Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 	1091291	
REFSEQ_DNA:NC_001148	NC_001148	Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 	948066	
 


Далее нам требовалось поработать немного с определенной хромосомой (с одной из хромосом выше). Мой номер - 18, значит хромосома, с которой мне работать - 2:
Длина - 813184
Количество генов белков - 408
Количество генов тРНК - 13
Пример гена, который находится на прямой цепи и не имеет интронов - gene="ATP1"; CDS - 37053..38690
Пример гена, который находится на обратной цепи и не имеет интронов - gene="PAU9; CDS - complement(7605..7733)
Пример гена, который находится на прямой цепи и имеет интрон - gene="SEC17"; CDS - join(125125..125154,125271..126119)
Пример гена, который находится на обратной цепи и имеет интрон - gene="SCS22"; CDS - complement(join(46565..47058,47147..47180))

Получение последовательности, кодирующей заданный белок

Белок grl4197 (Gloeobacter violaceus)был взят из базы данных RefSeq protein, где он имеет идентификатор NP_927143.1. При перекодировании был получен код доступа в базу данных Uniprot - Q7NDN8 (идентификатор записи GLIC_GLOVI). С помощью команды entret uniprot:GLIC_GLOVI в программе Putty была получена полная запись белка. Файл можно скачать по ССЫЛКЕ. В этом файле нашли АС записи в EMBL и с помощью команды entret embl:BAC92138.1 в putty получили ФАЙЛ с записью EMBL, кодирующей мой белок. (Чтобы скачать нажмите на слово ФАЙЛ). Далее был вырезан участок atgc, кодирующий мой белок, в отдельный файл (СКАЧАТЬ).

© Амосова Алена. 2013 год