Первым заданием было при помощи поисковой системы SRS вывести список хромосом Saccharomyces cerevisiae . Для выполнения этой задачи поисковой системе были заданы следующие параметры: Select Database - RefSeq_DNA (release); Organism_name: Saccharomyces cerevisiae; Molecule - DNA. Изначально было получено 19 результатов, неверные были отсеяны и осталось 16 верных записей:
REFSEQ_DNA:NC_001133 NC_001133 Saccharomyces cerevisiae S288c chromosome I, complete sequence. 230218REFSEQ_DNA:NC_001134 NC_001134 Saccharomyces cerevisiae S288c chromosome II, complete sequence. 813184 REFSEQ_DNA:NC_001135 NC_001135 Saccharomyces cerevisiae S288c chromosome III, complete sequence. 316620 REFSEQ_DNA:NC_001136 NC_001136 Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 1531933 REFSEQ_DNA:NC_001137 NC_001137 Saccharomyces cerevisiae S288c chromosome V, complete sequence. 576874 REFSEQ_DNA:NC_001138 NC_001138 Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 270161 REFSEQ_DNA:NC_001139 NC_001139 Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 1090940 REFSEQ_DNA:NC_001140 NC_001140 Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 562643 REFSEQ_DNA:NC_001141 NC_001141 Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 439888 REFSEQ_DNA:NC_001142 NC_001142 Saccharomyces cerevisiae S288c chromosome X, complete sequence. 745751 REFSEQ_DNA:NC_001143 NC_001143 Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 666816 REFSEQ_DNA:NC_001144 NC_001144 Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 1078177 REFSEQ_DNA:NC_001145 NC_001145 Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 924431 REFSEQ_DNA:NC_001146 NC_001146 Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 784333 REFSEQ_DNA:NC_001147 NC_001147 Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 1091291 REFSEQ_DNA:NC_001148 NC_001148 Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 948066
Мне необходимо было определить длину, количество генов белков и тРНК в XIII хромосоме данного организма. Длина = 924431 нуклеотида, количество генов белков = 461 и количество тРНК = 21.
Также, необходимо было ответить на несколько вопросов:
1.Ген, который находится на прямой цепи и не имеет интронов: COS3, координаты - 7244..8383
2.Ген, который находится на обратной цепи и не имеет интронов: ERO1, координаты - complement(11483..13174)
3.Ген, который находится на прямой цепи и имеет хотя бы один интрон: GIM5, координаты - join(<82275..82290,82374..>82849)
4.Ген, который находится на обратной цепи и имеет хотя бы один интрон: TUB3, координаты - complement(join(22048..23360,23659..23683))
В одном из практикумов прошлого семестра при помощи базы данных Uniprot для идентификатора YP_001196501.1 (RefSeq) получен идентификатор A5FC88_FLAI1 (UniProt). При помощи команды entret uniprot:A5FC88 мы получили AC на EMBL: CP000685. Координаты гена данного белка: (1826383..1826991), участок расположен на прямой цепи. Скачать последовательность, кодирующую данный ген можно здесь.