Нуклеотидные банки данных

Знакомство со структурой банка RefSeq посредством поисковой системы SRS

С помошью SRS был получен список хромосом дрожжей Saccharomyces cerevisiae.
Параметры поиска: база данных - RefSeq_DNA (release), форма запроса - Standart Qeury Form, Molecule - DNA и Organism Name - Saccharomyces cerevisiae.


	 REFSEQ_DNA:NC_001133	NC_001133	Saccharomyces cerevisiae S288c chromosome I, complete sequence. 	230218	
	REFSEQ_DNA:NC_001134	NC_001134	Saccharomyces cerevisiae S288c chromosome II, complete sequence. 	813184	
	REFSEQ_DNA:NC_001135	NC_001135	Saccharomyces cerevisiae S288c chromosome III, complete sequence. 	316620	
	REFSEQ_DNA:NC_001136	NC_001136	Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 	1531933	
	REFSEQ_DNA:NC_001137	NC_001137	Saccharomyces cerevisiae S288c chromosome V, complete sequence. 	576874	
	REFSEQ_DNA:NC_001138	NC_001138	Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 	270161	
	REFSEQ_DNA:NC_001139	NC_001139	Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 	1090940	
	REFSEQ_DNA:NC_001140	NC_001140	Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 	562643	
	REFSEQ_DNA:NC_001141	NC_001141	Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 	439888	
	REFSEQ_DNA:NC_001142	NC_001142	Saccharomyces cerevisiae S288c chromosome X, complete sequence. 	745751	
	REFSEQ_DNA:NC_001143	NC_001143	Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 	666816	
	REFSEQ_DNA:NC_001144	NC_001144	Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 	1078177	
	REFSEQ_DNA:NC_001145	NC_001145	Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 	924431	
	REFSEQ_DNA:NC_001146	NC_001146	Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 	784333	
	REFSEQ_DNA:NC_001147	NC_001147	Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 	1091291	
	REFSEQ_DNA:NC_001148	NC_001148	Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 	948066	
	 

Расмотрим хромосому номер XV. Ее параметры:

Рассмотрим примеры генов этой хромосомы, которые находятся на разных цепях и имеют разное количество интронов:
Цепь Число интронов Название Координаты CDS
Прямая 0 ATG34 165714..166952
Обратная 0 REX4 complement(180558..181427)
Прямая хотя бы 1 ABP140 join(784857..785687,785689..786744)
Обратная хотя бы 1 RPL33B complement(join(778555..778859,779387..779405))

Получение последовательности, кодирующей заданный белок
При помощи команды entret был найден файл с информацией о белке HUTI_BACSU из Saccharophagus degradans.
Команда:
entret sw:P42084

В нем 2 строки с началом DR EMBL: 1) DR EMBL; D31856; BAA06642.1; -; Genomic_DNA,
2) DR EMBL; AL009126; CAB15973.1; -; Genomic_DNA.

Чтобы найти последовательность, воспользуемся командой
entret embl:D31856
Теперь известен CDS кодирующего участка - complement(2816..4081).
С помощью команды seqret -sask вырежем интересующий нас участок. Получен файл в формате fasta.


© Андреева Анна, 2012 (Последнее исправление: 14.02.2014)