Нуклеотидные банки данных

Знакомство с RefSeq

Через SRS был произведен поиск хромосом дрожжей Saccharomyces cerevisiae. Результаты (всего 16 хромосом) представлены ниже.

REFSEQ_DNA:NC_001133 NC_001133 Saccharomyces cerevisiae S288c chromosome I, complete sequence. 230218 REFSEQ_DNA:NC_001134 NC_001134 Saccharomyces cerevisiae S288c chromosome II, complete sequence. 813184 REFSEQ_DNA:NC_001135 NC_001135 Saccharomyces cerevisiae S288c chromosome III, complete sequence. 316620 REFSEQ_DNA:NC_001136 NC_001136 Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 1531933 REFSEQ_DNA:NC_001137 NC_001137 Saccharomyces cerevisiae S288c chromosome V, complete sequence. 576874 REFSEQ_DNA:NC_001138 NC_001138 Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 270161 REFSEQ_DNA:NC_001139 NC_001139 Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 1090940 REFSEQ_DNA:NC_001140 NC_001140 Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 562643 REFSEQ_DNA:NC_001141 NC_001141 Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 439888 REFSEQ_DNA:NC_001142 NC_001142 Saccharomyces cerevisiae S288c chromosome X, complete sequence. 745751 REFSEQ_DNA:NC_001143 NC_001143 Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 666816 REFSEQ_DNA:NC_001144 NC_001144 Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 1078177 REFSEQ_DNA:NC_001145 NC_001145 Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 924431 REFSEQ_DNA:NC_001146 NC_001146 Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 784333 REFSEQ_DNA:NC_001147 NC_001147 Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 1091291 REFSEQ_DNA:NC_001148 NC_001148 Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 948066

Для седьмой хромосомы также были выяснены следующие параметры: Табл. 1. Примеры разных генов на седьмой хромосоме.
Тип гена Пример Координаты CDS
Тип гена Пример Координаты
ген, который находится на прямой цепи и не имеет интронов gene="HXK2" 23935..25395
ген, который находится на обратной цепи и не имеет интронов gene="EMC4" complement(63048..63620)
ген, который находится на прямой цепи и имеет хотя бы один интрон gene="TAN1" join(62075..62131,62190..63002)
ген, который находится на обратной цепи и имеет хотя бы один интрон gene="HFM1" complement(join(27921..31426,31579..31636))

Получение последовательности, кодирующей заданный белок

С помощью команды

entret sw:YPWA_BACSU

был получен файл со сведениями о белке, в котором нужно было найти AC белка в EMBL (напротив строки, начинающейся с DR EMBL). Запустив аналогичную команду в EMBL

entret embl:L747838,

в выходном файле находим границы CDS белка. Окончательной командой

seqret embl:L47838 -sask,

затем выставив позицию начала и конца рамки считывания, а также указав цепь ДНК, был сформирован файл с последовательностью белка.

© Elizaveta Besedina, FBB 2012
lizaveta@kodomo.fbb.msu.ru