Нуклеотдные банки данных
SRS
При помощи системы SRS был получен список хромосом Saccharomyces cerevisiae:
REFSEQ_DNA:NC_001134 NC_001134 Saccharomyces cerevisiae S288c chromosome II, complete sequence. 813184
REFSEQ_DNA:NC_001135 NC_001135 Saccharomyces cerevisiae S288c chromosome III, complete sequence. 316620
REFSEQ_DNA:NC_001136 NC_001136 Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 1531933
REFSEQ_DNA:NC_001137 NC_001137 Saccharomyces cerevisiae S288c chromosome V, complete sequence. 576874
REFSEQ_DNA:NC_001138 NC_001138 Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 270161
REFSEQ_DNA:NC_001139 NC_001139 Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 1090940
REFSEQ_DNA:NC_001140 NC_001140 Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 562643
REFSEQ_DNA:NC_001141 NC_001141 Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 439888
REFSEQ_DNA:NC_001142 NC_001142 Saccharomyces cerevisiae S288c chromosome X, complete sequence. 745751
REFSEQ_DNA:NC_001143 NC_001143 Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 666816
REFSEQ_DNA:NC_001144 NC_001144 Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 1078177
REFSEQ_DNA:NC_001145 NC_001145 Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 924431
REFSEQ_DNA:NC_001146 NC_001146 Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 784333
REFSEQ_DNA:NC_001147 NC_001147 Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 1091291
REFSEQ_DNA:NC_001148 NC_001148 Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 948066
Расмотрим хромосому номер XV. Ее длина равна 1091291 нуклеотидов, и в ней записано 569 генов и 20 тРНК.
Ниже приведены примеры генов этой хромосомы, находящихся на разных цепях и имеющих разное количество интронов.
Цепь |
Число интронов |
Название |
Координаты CDS |
Прямая |
0 |
BDS1 |
6175..8115 |
Обратная |
0 |
PAU20 |
complement(11549..11911) |
Прямая |
1 |
RPL25 |
join(80348..80360,80775..81190) |
Обратная |
1 |
RPS19A |
complement(join(92026..92440,92831..92850)) |
EMBL
С помощью команды entret был найден идентиикатор записи EMBL о данном белке (аденилат киназа, P16304 - AC в UniProt). Команда:
entret sw:P16304
В полученном файле была найдена строка "DR EMBL", в которй записаны идентификаторы нескольких записей в EMBL о данном белке. Из приведенных идентификаторов выберем D00619 и запустим команду
entret embl:D00619
В полученном файле указаны координаты CDS гена рассматриваемого белка. Чтобу получить последовательность этого гена, нужно вырезать ее из полученного файла, это делается командой seqret:
seqret -sask
После запуска программы нужно указать начало и конец искомого участка, а также файл выдачи. Таким образом, был получен файл с последовательностью гена аденилат киназы.
© Марк Меерсон, 2013
Последнее обновление: 17.11.2013