Нуклеотидные банки данных
Задание 1. Знакомство со структурой банка RefSeq посредством поисковой системы SRS
a. В SRC я получила список хромосом дрожжей Saccharomyces cerevisiae.
REFSEQ_DNA:NC_001133 NC_001133 Saccharomyces cerevisiae S288c chromosome I, complete sequence. 230218
REFSEQ_DNA:NC_001134 NC_001134 Saccharomyces cerevisiae S288c chromosome II, complete sequence. 813184
REFSEQ_DNA:NC_001135 NC_001135 Saccharomyces cerevisiae S288c chromosome III, complete sequence. 316620
REFSEQ_DNA:NC_001136 NC_001136 Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 1531933
REFSEQ_DNA:NC_001137 NC_001137 Saccharomyces cerevisiae S288c chromosome V, complete sequence. 576874
REFSEQ_DNA:NC_001138 NC_001138 Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 270161
REFSEQ_DNA:NC_001139 NC_001139 Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 1090940
REFSEQ_DNA:NC_001140 NC_001140 Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 562643
REFSEQ_DNA:NC_001141 NC_001141 Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 439888
REFSEQ_DNA:NC_001142 NC_001142 Saccharomyces cerevisiae S288c chromosome X, complete sequence. 745751
REFSEQ_DNA:NC_001143 NC_001143 Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 666816
REFSEQ_DNA:NC_001144 NC_001144 Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 1078177
REFSEQ_DNA:NC_001145 NC_001145 Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 924431
REFSEQ_DNA:NC_001146 NC_001146 Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 784333
REFSEQ_DNA:NC_001147 NC_001147 Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 1091291
REFSEQ_DNA:NC_001148 NC_001148 Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 948066
b. Мне досталась первая хромосома. Итак, в таблице ниже представлена некоторая информация об этой хромосоме.
Длина хромосомы
|
Количество генов
|
Количество тРНК
|
230218
|
102 |
4
|
c. Примеры генов:
- ген, который находится на прямой цепи и не имеет интронов: gene="GPB2", CDS:39259..41901
- ген, который находится на обратной цепи и не имеет интронов: gene="GEM1", CDS:complement(52801..54789)
- ген, который находится на обратной цепи и имеет хотя бы один интрон: gene="TFC3", СDS:complement(join(147594..151006,151097..151166))
- ген, который находится на прямой цепи и имеет хотя бы один интрон: gene="SNC1", СDS:join(87286..87387,87501..87752)
Задание 2. Получение последовательности, кодирующей заданный белок
AC белка в EMBL: X73124
Найденный АС был использован для получения записи с помощью команды entret embl: X73124. В нем, воспользовавшись поиском по документу (Find: P39594), были найдены границы CDS гена, кодирующего мой белок.
Далее с помощью команды seqret -sask был вырезан тот участок последвательности, который кодирует белок THIE_BACSU.
Файл c геном, кодирующим мой белок.
© Novikova Maria, 2013
Последнее обновление: 17.11.2013