К сожалению, мне не удалось воспользоваться поисковой системой SRS, так как при выборе "Select Databanks" в меню, выдавалась следующая ошибка:
Поэтому я решила воспользоваться PubMed для поиска статьи с полной аннотацией генома Saccharomyces cerevisiae (спасибо Валентине Масловой за идею). В найденной статье (см. ссылку MEDLINE) содержатся ссылки на последовательности хромосом в Nucleotide базе данных NCBI.
Затем, через некоторое время (нексколько недель), мне все же удалось воспользоваться поисковой системой SRS. Полученный список хромосом после указанных на странице задания действий:
REFSEQ_DNA:NC_001133 NC_001133 Saccharomyces cerevisiae S288c chromosome I, complete sequence. 230218 REFSEQ_DNA:NC_001134 NC_001134 Saccharomyces cerevisiae S288c chromosome II, complete sequence. 813184 REFSEQ_DNA:NC_001135 NC_001135 Saccharomyces cerevisiae S288c chromosome III, complete sequence. 316620 REFSEQ_DNA:NC_001136 NC_001136 Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 1531933 REFSEQ_DNA:NC_001137 NC_001137 Saccharomyces cerevisiae S288c chromosome V, complete sequence. 576874 REFSEQ_DNA:NC_001138 NC_001138 Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 270161 REFSEQ_DNA:NC_001139 NC_001139 Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 1090940 REFSEQ_DNA:NC_001140 NC_001140 Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 562643 REFSEQ_DNA:NC_001141 NC_001141 Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 439888 REFSEQ_DNA:NC_001142 NC_001142 Saccharomyces cerevisiae S288c chromosome X, complete sequence. 745751 REFSEQ_DNA:NC_001143 NC_001143 Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 666816 REFSEQ_DNA:NC_001144 NC_001144 Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 1078177 REFSEQ_DNA:NC_001145 NC_001145 Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 924431 REFSEQ_DNA:NC_001146 NC_001146 Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 784333 REFSEQ_DNA:NC_001147 NC_001147 Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 1091291 REFSEQ_DNA:NC_001148 NC_001148 Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 948066
Мой номер в списке: 2, поэтому номер исследуемой мной в дальнейшем хромосомы - 1+2 = 3
Длина - 316620 bp (пар оснований)
Количество генов белков (CDS) - 161
Количество генов тРНК (tRNA) - 10
Дельнейшим заданием было привести пример следующих генов:
Параметры искомого гена | Название гена (gene=) | Координаты |
находится на прямой цепи и не имеет интронов | VBA3 | 9706..11082 |
находится на обратной цепи и не имеет интронов | GEX1 | complement(6479..8326) |
находится на прямой цепи и имеет хотя бы один интрон | YCL019W | join(85102..86391,86393..90415) |
находится на обратной цепи и имеет хотя бы один интрон | YCL002C | complement(join(110808..111557,111634..111675)) |
Следующим заданием было найти Uniprot ID и AC белка с идентификатором RefSeq NP_560184.1 (Alcohol dehydrogenase археи Pyrobaculum aerophilum). С помощью сервиса ID Mapping было найдено: ID Q8ZUP0_PYRAE, AC Q8ZUP0. С помощью этого же сервиса был получен идентификатор записи (AC) гена, кодирующего этот белок, в EMBL: AAL64366.1. Полного генома: AE009441. С помощью команды entret embl:AE009441 был получен файл с полным геномом исследуемого мной прокариотического организма. В полученном файле были найдены координаты гена заданного белка: complement(1595777..1596772). Далее я воспользовалась командой seqret с опцией -sask, для того, чтобы получить нуклеотидную последовательность гена, кодирующего исследуемый белок.
seqret -sask Read and write (return) sequences Input (gapped) sequence(s): ae009441.entret Begin at position [start]: 1595777 End at position [end]: 1596772 Reverse strand [N]: Y output sequence(s) [ae009441.fasta]: aal64366.1.fasta
В результате этих действий был получен файл с последовательностью ДНК искомого гена: