Учебный сайт Валяевой Анны

Нуклеотидные банки данных

Знакомство со структурой банка RefSeq посредством поисковой системы SRS

С помощью поисковой системы SRS в банке последовательностей RefSeq были найдены записи с последовательностями хромосом дрожжей Saccharomyces cerevisiae:


 REFSEQ_DNA:NC_001133 	NC_001133	Saccharomyces cerevisiae S288c chromosome I, complete sequence. 	230218	
 REFSEQ_DNA:NC_001134	NC_001134	Saccharomyces cerevisiae S288c chromosome II, complete sequence. 	813184	
 REFSEQ_DNA:NC_001135	NC_001135	Saccharomyces cerevisiae S288c chromosome III, complete sequence. 	316620	
 REFSEQ_DNA:NC_001136	NC_001136	Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 	1531933	
 REFSEQ_DNA:NC_001137	NC_001137	Saccharomyces cerevisiae S288c chromosome V, complete sequence. 	576874	
 REFSEQ_DNA:NC_001138	NC_001138	Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 	270161	
 REFSEQ_DNA:NC_001139	NC_001139	Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 	1090940	
 REFSEQ_DNA:NC_001140	NC_001140	Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 	562643	
 REFSEQ_DNA:NC_001141	NC_001141	Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 	439888	
 REFSEQ_DNA:NC_001142	NC_001142	Saccharomyces cerevisiae S288c chromosome X, complete sequence. 	745751	
 REFSEQ_DNA:NC_001143	NC_001143	Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 	666816	
 REFSEQ_DNA:NC_001144	NC_001144	Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 	1078177	
 REFSEQ_DNA:NC_001145	NC_001145	Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 	924431	
 REFSEQ_DNA:NC_001146	NC_001146	Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 	784333	
 REFSEQ_DNA:NC_001147	NC_001147	Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 	1091291	
 REFSEQ_DNA:NC_001148	NC_001148	Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 	948066

В хромосоме II (NC_001134), длиной 813184 пар оснований, закодировано 408 последовательностей белков и 13 тРНК.

Ген, который находится на прямой цепи и не имеет интронов: AIM3, его координаты (454822..457665).
Ген, который находится на обратной цепи и не имеет интронов: RPS8A, его координаты complement(88523..89125).
Ген, который находится на прямой цепи и имеет хотя бы один интрон: RPS9B, его координаты (604508..604514,604928..605508).
Ген, который находится на обратной цепи и имеет хотя бы один интрон: POP8, его координаты complement(185998..186352,186428..186474).

Получение последовательности, кодирующей заданный белок

Доставшийся мне белок - белок с идентификатором NP_070832.1 из археи Archaeoglobus fulgidus. Его Uniprot ID: O28271_ARCFU, AC: O28271.

Чтобы определить его AC записи EMBL, я использовала команды

entret uniprot:O28271
    egrep "^DR   EMBL" o28271_arcfu.entret  > AC_EMBL.txt
в putty на kodomo. В полученном файле AC_EMBL.txt был записан AC данного белка: AE000782.

Далее я определила границы и направление кодирующего участка этого белка: complement(1806881..1807201), из файла ae000782.entret, полученного командой entret embl:AE000782. А с помощью команды seqret с опцией -sask была получена последовательность гена данного белка, которая была записана в файл ae000782.fasta.

Дата последнего обновления: 12.10.14
©Валяева Анна