|
Нуклеотидные банки данных
В качестве первого задания нужно было вывести список хромосом дрожжей Saccharomyces cerevisiae, полученный с помощью SRS.
В гаплоидном наборе 16 хромосом, ниже приведен список:
REFSEQ_DNA:NC_001133 NC_001133 Saccharomyces cerevisiae S288c chromosome I, complete sequence. 230218
REFSEQ_DNA:NC_001134 NC_001134 Saccharomyces cerevisiae S288c chromosome II, complete sequence. 813184
REFSEQ_DNA:NC_001135 NC_001135 Saccharomyces cerevisiae S288c chromosome III, complete sequence. 316620
REFSEQ_DNA:NC_001136 NC_001136 Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 1531933
REFSEQ_DNA:NC_001137 NC_001137 Saccharomyces cerevisiae S288c chromosome V, complete sequence. 576874
REFSEQ_DNA:NC_001138 NC_001138 Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 270161
REFSEQ_DNA:NC_001139 NC_001139 Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 1090940
REFSEQ_DNA:NC_001140 NC_001140 Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 562643
REFSEQ_DNA:NC_001141 NC_001141 Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 439888
REFSEQ_DNA:NC_001142 NC_001142 Saccharomyces cerevisiae S288c chromosome X, complete sequence. 745751
REFSEQ_DNA:NC_001143 NC_001143 Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 666816
REFSEQ_DNA:NC_001144 NC_001144 Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 1078177
REFSEQ_DNA:NC_001145 NC_001145 Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 924431
REFSEQ_DNA:NC_001146 NC_001146 Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 784333
REFSEQ_DNA:NC_001147 NC_001147 Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 1091291
REFSEQ_DNA:NC_001148 NC_001148 Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 948066
Далее надо было описать подробнее хромосому XIV. Для удобства я приведу небольшую таблицу:
Таблица 1. Chromosome XIV.
Поле информации |
Расшифровка |
Значение |
Sequence Length |
Длина последовательности |
784333 |
CDS |
Количество кодируемых белков |
398 |
tRNA |
Количество кодируемых tRNA |
14 |
Следующая таблица для примеров различных генов:
Таблица 2. Примеры генов.
Описание |
Название |
Координаты |
Ген, который находится на прямой цепи и не имеет интронов |
MFA2 |
<352414..>352530 |
Ген, который находится на обратной цепи и не имеет интронов |
PGA2 |
complement(<349367..>349756) |
Ген, который находится на прямой цепи и имеет хотя бы один интрон |
YSF3 |
join(<366033..366035,366158..>366412) |
Ген, который находится на обратной цепи и имеет хотя бы один интрон |
IST1 |
complement(join(<144280..145149,145255..>145281)) |
Для второго задания надо было найти AC моего белка из первого семестра в EMBL. Для этого я воспользовалась программой
entret на сервере kodomo. Полученный АС: CP000383. C помощью все той же программы я загрузила файл с полной
записью генома из EMBL. В ней я нашла свой ген по названию /gene="tfdD", которое я выясняла еще в первом семестре,
и его координаты: complement(2486267..2487373). Далее я воспользовалась два раза программой seqret (для создания
файла в fasta-формате с записью полного генома и для создания
файла в fasta-формате с записью гена моего белка).
|