Вернуться на страницу семестров

Знакомство со структурой банка RefSeq посредством поисковой системы SRS


     Задание 1, упраженение A. Хромосомы Saccharomyces cerevisiae, полученные из SRS:

REFSEQ_DNA:NC_001133	NC_001133	Saccharomyces cerevisiae S288c chromosome I, complete sequence. 	230218	
REFSEQ_DNA:NC_001134	NC_001134	Saccharomyces cerevisiae S288c chromosome II, complete sequence. 	813184	
REFSEQ_DNA:NC_001135	NC_001135	Saccharomyces cerevisiae S288c chromosome III, complete sequence. 	316620	
REFSEQ_DNA:NC_001136	NC_001136	Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 	1531933	
REFSEQ_DNA:NC_001137	NC_001137	Saccharomyces cerevisiae S288c chromosome V, complete sequence. 	576874	
REFSEQ_DNA:NC_001138	NC_001138	Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 	270161	
REFSEQ_DNA:NC_001139	NC_001139	Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 	1090940	
REFSEQ_DNA:NC_001140	NC_001140	Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 	562643	
REFSEQ_DNA:NC_001141	NC_001141	Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 	439888	
REFSEQ_DNA:NC_001142	NC_001142	Saccharomyces cerevisiae S288c chromosome X, complete sequence. 	745751	
REFSEQ_DNA:NC_001143	NC_001143	Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 	666816	
REFSEQ_DNA:NC_001144	NC_001144	Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 	1078177	
REFSEQ_DNA:NC_001145	NC_001145	Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 	924431	
REFSEQ_DNA:NC_001146	NC_001146	Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 	784333	
REFSEQ_DNA:NC_001147	NC_001147	Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 	1091291	
REFSEQ_DNA:NC_001148	NC_001148	Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 	948066	


     Задание 1, упраженение B. Описание хромосомы II.

Accession # - NC_001134
Sequence Length (Длина) - 813184
Генов - 425
Генов т-РНК - 13


     Задание 1, упраженение C. Пример 4-ех генов.

-ген,который находится на прямой цепи и не имеет интронов: SFT2 (24098..24745)

-ген,который находится на обратной цепи и не имеет интронов: ECM21 (24946..28299)

-ген,который находится на прямой цепи и имеет хотя бы один интрон: YBR012W-B join(259869..261173,261175..265140)

-ген,который находится на обратной цепи и имеет хотя бы один интрон: POP8 join(185998..186352,186428..186474)


     Задание 2. Получение последовательности, кодирующей заданный белок.

Чтобы получить информацию о гене, что кодирует белок OPUAC_BACSU, и его AC в банке EMBL, была использована команда: entret sw:P46922
Ссылка на файл, полученный командой entret sw:P46922

Чтобы найти участок, была использована следующая команда: entret embl:U17292
• AC записи в EMBL - u17292
• Кодирующий белок участок - CDS (2332..3213), находится на прямой цепи.
Ссылка на файл, полученный командой entret embl:U17292

Вырезан участок, кодирующий белок, с помощью команды seqret -sask, в которой надо указать откуда и до какого участка нужно вырезать
Ссылка на файл, полученный командой seqret -sask


     Задание 4 (дополнительное, добавлено 20.11.13). Поиск в нуклеотидном банке NCBI по имени гена.

Для анализа, я взял ген ECM21 из задания 1, который находится на обратной цепи и не имеет интронов. В нуклеотидном банке NCBI, введя название гена, я получил 65 записей. Узнал, что данный ген известен под другим именем, а именно ART2. В PubMed есть 31 запрос на данный ген. Описана его функция, отвечающая за образование лизина(63), который ингибирует Rsp5, необходимый в цитоплазме для предотвращения протеотоксического стресса, который приводит к повреждению репликации ДНК.