A picture of DNA should be here

Нуклеотидные банки данных

К сожалению, мне не удалось воспользоваться поисковой системой SRS, так как при выборе "Select Databanks" в меню, выдавалась следующая ошибка:

Поэтому я решила воспользоваться PubMed для поиска статьи с полной аннотацией генома Saccharomyces cerevisiae (спасибо Валентине Масловой за идею). В найденной статье (см. ссылку MEDLINE) содержатся ссылки на последовательности хромосом в Nucleotide базе данных NCBI.

Затем, через некоторое время (нексколько недель), мне все же удалось воспользоваться поисковой системой SRS. Полученный список хромосом после указанных на странице задания действий:

REFSEQ_DNA:NC_001133	NC_001133	Saccharomyces cerevisiae S288c chromosome I, complete sequence. 	230218	
REFSEQ_DNA:NC_001134	NC_001134	Saccharomyces cerevisiae S288c chromosome II, complete sequence. 	813184	
REFSEQ_DNA:NC_001135	NC_001135	Saccharomyces cerevisiae S288c chromosome III, complete sequence. 	316620	
REFSEQ_DNA:NC_001136	NC_001136	Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 	1531933	
REFSEQ_DNA:NC_001137	NC_001137	Saccharomyces cerevisiae S288c chromosome V, complete sequence. 	576874	
REFSEQ_DNA:NC_001138	NC_001138	Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 	270161	
REFSEQ_DNA:NC_001139	NC_001139	Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 	1090940	
REFSEQ_DNA:NC_001140	NC_001140	Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 	562643	
REFSEQ_DNA:NC_001141	NC_001141	Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 	439888	
REFSEQ_DNA:NC_001142	NC_001142	Saccharomyces cerevisiae S288c chromosome X, complete sequence. 	745751	
REFSEQ_DNA:NC_001143	NC_001143	Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 	666816	
REFSEQ_DNA:NC_001144	NC_001144	Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 	1078177	
REFSEQ_DNA:NC_001145	NC_001145	Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 	924431	
REFSEQ_DNA:NC_001146	NC_001146	Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 	784333	
REFSEQ_DNA:NC_001147	NC_001147	Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 	1091291	
REFSEQ_DNA:NC_001148	NC_001148	Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 	948066	

Мой номер в списке: 2, поэтому номер исследуемой мной в дальнейшем хромосомы - 1+2 = 3

Длина - 316620 bp (пар оснований)

Количество генов белков (CDS) - 161

Количество генов тРНК (tRNA) - 10

Дельнейшим заданием было привести пример следующих генов:

Параметры искомого гена Название гена (gene=) Координаты
находится на прямой цепи и не имеет интронов VBA3 9706..11082
находится на обратной цепи и не имеет интронов GEX1 complement(6479..8326)
находится на прямой цепи и имеет хотя бы один интрон YCL019W join(85102..86391,86393..90415)
находится на обратной цепи и имеет хотя бы один интрон YCL002C complement(join(110808..111557,111634..111675))

Следующим заданием было найти Uniprot ID и AC белка с идентификатором RefSeq NP_560184.1 (Alcohol dehydrogenase археи Pyrobaculum aerophilum). С помощью сервиса ID Mapping было найдено: ID Q8ZUP0_PYRAE, AC Q8ZUP0. С помощью этого же сервиса был получен идентификатор записи (AC) гена, кодирующего этот белок, в EMBL: AAL64366.1. Полного генома: AE009441. С помощью команды entret embl:AE009441 был получен файл с полным геномом исследуемого мной прокариотического организма. В полученном файле были найдены координаты гена заданного белка: complement(1595777..1596772). Далее я воспользовалась командой seqret с опцией -sask, для того, чтобы получить нуклеотидную последовательность гена, кодирующего исследуемый белок.

seqret -sask
Read and write (return) sequences
Input (gapped) sequence(s): ae009441.entret
Begin at position [start]: 1595777
End at position [end]: 1596772
Reverse strand [N]: Y
output sequence(s) [ae009441.fasta]: aal64366.1.fasta

В результате этих действий был получен файл с последовательностью ДНК искомого гена: