SRS и RefSeq
В задании требовалось с помощью поисковой системы SRS вывести список хромосом дрожжей Saccharomyces cerevisiae. Поиск производился по бакну данных "RefSeq_DNA (release)". В качестве формы запроса исользовался "Standard Query Form". В форме были заполнены поля Organism Name и Molecule значениями "Saccharomyces cerevisiae" и "DNA", соответственно.
В таблице 1 представлены результаты поиска:
AC |
Description |
NC_001133 |
Saccharomyces cerevisiae S288c chromosome I, complete sequence. |
NC_001134 |
Saccharomyces cerevisiae S288c chromosome II, complete sequence. |
NC_001135 |
Saccharomyces cerevisiae S288c chromosome III, complete sequence. |
NC_001136 |
Saccharomyces cerevisiae S288c chromosome IV, complete sequence. |
NC_001137 |
Saccharomyces cerevisiae S288c chromosome V, complete sequence. |
NC_001138 |
Saccharomyces cerevisiae S288c chromosome VI, complete sequence. |
NC_001139 |
Saccharomyces cerevisiae S288c chromosome VII, complete sequence. |
NC_001140 |
Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. |
NC_001141 |
Saccharomyces cerevisiae S288c chromosome IX, complete sequence. |
NC_001142 |
Saccharomyces cerevisiae S288c chromosome X, complete sequence. |
NC_001143 |
Saccharomyces cerevisiae S288c chromosome XI, complete sequence. |
NC_001144 |
Saccharomyces cerevisiae S288c chromosome XII, complete sequence. |
NC_001145 |
Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. |
NC_001146 |
Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. |
NC_001147 |
Saccharomyces cerevisiae S288c chromosome XV, complete sequence. |
NC_001148 |
Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. |
В таблице 2 приведены значения параметров шестой хромосомы Saccharomyces cerevisiae:
Saccharomyces cerevisiae S288c chromosome VI |
|
Длина хромосомы |
270161 |
Количество генов |
141 |
тРНК |
10 |
В таблице представлены примеры генов хромосомы VI с определенными параметрами:
Пример гена, который... |
Название гена |
Координаты соответствующей CDS |
...находится на прямой цепи и не имеет интронов |
COS4 |
6426. .7565 |
...находится на обратной цепи и не имеет интронов |
SNO3 |
complement(10301. .10969) |
...находится на прямой цепи и имеет хотя бы один интрон |
HAC1 |
75179..76147 |
...находится на обратной цепи и имеет хотя бы один интрон |
RPL22B |
complement(64243..64932) |
EMBL
Чтобы узнать информацию от гене, кодирующем белок MANB1_BACSU, в том числе определить номера AC банка EMBL, в Putty была использована команда "entret sw:O05512", где O05512 является идентификатором белка в UniProt.
AC записи EMBL, в которой описан ген этого белка: D88802; BAA19712.1; AL009126; CAB12407.2;
Чтобы вырезать участок, кодирующий белок MANB1_BACSU, для начала, используя команду
"entret embl:D88802", была определена граница кодирующего участка.
Границы CDS: 18792..19880.
Далее, воспользовавшись командой seqret с опцией -sask, был получен кодирующий участок ДНК.
Путь к файлу с последовательностью гена: ~/term3/block3/credits/d88802.fasta.