Хромосомы Saccharomyces cerevisiae и поисковая система SRS
С помощью SRS был получен список хромосом дрожжей Saccharomyces cerevisiae:
REFSEQ_DNA:NC_001133 NC_001133 Saccharomyces cerevisiae S288c chromosome I, complete sequence. 230218 REFSEQ_DNA:NC_001134 NC_001134 Saccharomyces cerevisiae S288c chromosome II, complete sequence. 813184 REFSEQ_DNA:NC_001135 NC_001135 Saccharomyces cerevisiae S288c chromosome III, complete sequence. 316620 REFSEQ_DNA:NC_001136 NC_001136 Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 1531933 REFSEQ_DNA:NC_001137 NC_001137 Saccharomyces cerevisiae S288c chromosome V, complete sequence. 576874 REFSEQ_DNA:NC_001138 NC_001138 Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 270161 REFSEQ_DNA:NC_001139 NC_001139 Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 1090940 REFSEQ_DNA:NC_001140 NC_001140 Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 562643 REFSEQ_DNA:NC_001141 NC_001141 Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 439888 REFSEQ_DNA:NC_001142 NC_001142 Saccharomyces cerevisiae S288c chromosome X, complete sequence. 745751 REFSEQ_DNA:NC_001143 NC_001143 Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 666816 REFSEQ_DNA:NC_001144 NC_001144 Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 1078177 REFSEQ_DNA:NC_001145 NC_001145 Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 924431 REFSEQ_DNA:NC_001146 NC_001146 Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 784333 REFSEQ_DNA:NC_001147 NC_001147 Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 1091291 REFSEQ_DNA:NC_001148 NC_001148 Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 948066
Далее приведена информация о 16 хромосоме и о некоторых генах, принадлежащих ей.
Длина хромосомы: 948066 пар оснований (BP), количество генов: 490, количество тРНК: 17.
На хромосоме есть различные гены.
1. Ген, который находится на прямой цепи и не имеет интронов: HSP32 (CDS 11887..12600).
gene 11887..12600 /gene="HSP32" /locus_tag="YPL280W" /db_xref="GeneID:855849"
2. Ген, который находится на обратной цепи и не имеет интронов: ERR2 (CDS 9557..10870).
gene complement(9557..10870) /gene="ERR2" /locus_tag="YPL281C" /db_xref="GeneID:855848"
3. Ген, который находится на прямой цепи и имеет хотя бы один интрон: RPL43A (CDS join(654166..654167,654571..654847).
gene 654166..654847 /gene="RPL43A" /locus_tag="YPR043W" /db_xref="GeneID:856156"
4. Гена, который находится на обратной цепи и имеет хотя бы один интрон: YPR063C (CDS complement(join(677812..678193,678280..678320)).
gene complement(677812..678320) /locus_tag="YPR063C" /db_xref="GeneID:856176"
Поиск последовательности, кодирующей определенный белок
Была найдена запись EMBL о нуклеотидной последовательности, кодирующей белок с АС (UniProt) P37527, из файла pdxs_bacsu.entret, полученного с помощью команды:
AC записи EMBL гена: AL009126.
Был получен файл al009126.entret с полной записью EMBL с помощью команды:
В выдаче были найдены границы кодирующего участка: CDS 19062..19946. Соответственно, по ним был найден и вырезан в отдельный файл участок, кодирующий интересующий белок, с помощью команды:
Последовательность можно увидеть в файле: pdxs_bacsu_gene.fasta
Как было выяснено, ген считывается с прямой цепи ДНК, поэтому в программе не изменялась стандартная последовательность.
Гены в NCBI
Выполняющий работу хочет выразить большой восторг по поводу поиска информации о генах с помощью NCBI, к которому он постоянно прибегает. С помощью NCBI исследователь может скорейшим образом найти концентрированную важную информацию о расположении, функции и продукте гена, а также статьи, в которых были описаны эти данные.