Учебный сайт Валяевой Анны
Нуклеотидные банки данных
Знакомство со структурой банка RefSeq посредством поисковой системы SRS
С помощью поисковой системы SRS в банке последовательностей RefSeq были найдены записи с последовательностями хромосом дрожжей Saccharomyces cerevisiae:
REFSEQ_DNA:NC_001133 NC_001133 Saccharomyces cerevisiae S288c chromosome I, complete sequence. 230218 REFSEQ_DNA:NC_001134 NC_001134 Saccharomyces cerevisiae S288c chromosome II, complete sequence. 813184 REFSEQ_DNA:NC_001135 NC_001135 Saccharomyces cerevisiae S288c chromosome III, complete sequence. 316620 REFSEQ_DNA:NC_001136 NC_001136 Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 1531933 REFSEQ_DNA:NC_001137 NC_001137 Saccharomyces cerevisiae S288c chromosome V, complete sequence. 576874 REFSEQ_DNA:NC_001138 NC_001138 Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 270161 REFSEQ_DNA:NC_001139 NC_001139 Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 1090940 REFSEQ_DNA:NC_001140 NC_001140 Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 562643 REFSEQ_DNA:NC_001141 NC_001141 Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 439888 REFSEQ_DNA:NC_001142 NC_001142 Saccharomyces cerevisiae S288c chromosome X, complete sequence. 745751 REFSEQ_DNA:NC_001143 NC_001143 Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 666816 REFSEQ_DNA:NC_001144 NC_001144 Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 1078177 REFSEQ_DNA:NC_001145 NC_001145 Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 924431 REFSEQ_DNA:NC_001146 NC_001146 Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 784333 REFSEQ_DNA:NC_001147 NC_001147 Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 1091291 REFSEQ_DNA:NC_001148 NC_001148 Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 948066
В хромосоме II (NC_001134), длиной 813184 пар оснований, закодировано 408 последовательностей белков и 13 тРНК.
Ген, который находится на прямой цепи и не имеет интронов: AIM3, его координаты (454822..457665).
Ген, который находится на обратной цепи и не имеет интронов: RPS8A, его координаты complement(88523..89125).
Ген, который находится на прямой цепи и имеет хотя бы один интрон: RPS9B, его координаты (604508..604514,604928..605508).
Ген, который находится на обратной цепи и имеет хотя бы один интрон: POP8, его координаты complement(185998..186352,186428..186474).
Получение последовательности, кодирующей заданный белок
Доставшийся мне белок - белок с идентификатором NP_070832.1 из археи Archaeoglobus fulgidus. Его Uniprot ID: O28271_ARCFU, AC: O28271.
Чтобы определить его AC записи EMBL, я использовала команды
entret uniprot:O28271 egrep "^DR EMBL" o28271_arcfu.entret > AC_EMBL.txtв putty на kodomo. В полученном файле AC_EMBL.txt был записан AC данного белка: AE000782.
Далее я определила границы и направление кодирующего участка этого белка: complement(1806881..1807201), из файла ae000782.entret, полученного командой entret embl:AE000782. А с помощью команды seqret с опцией -sask была получена последовательность гена данного белка, которая была записана в файл ae000782.fasta.
Дата последнего обновления: 12.10.14
©Валяева Анна