Нуклеотидные банки данных

Знакомство со структурой банка RefSeq посредством поисковой системы SRS

С помощью поисковой системы SRS был получен список хромосом дрожжей Saccharomyces cerevisiae, приведенный в таблице 1.

Таблица 1. Список хромосом дрожжей Saccharomyces cerevisiae
RefSeq_DNA (release) Accession Описание последовательности Длина последовательности
REFSEQ_DNA:NC_001133 NC_001133 Saccharomyces cerevisiae S288c chromosome I, complete sequence. 230218
REFSEQ_DNA:NC_001134 NC_001134 Saccharomyces cerevisiae S288c chromosome II, complete sequence. 813184
REFSEQ_DNA:NC_001135 NC_001135 Saccharomyces cerevisiae S288c chromosome III, complete sequence. 316620
REFSEQ_DNA:NC_001136 NC_001136 Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 1531933
REFSEQ_DNA:NC_001137 NC_001137 Saccharomyces cerevisiae S288c chromosome V, complete sequence. 576874
REFSEQ_DNA:NC_001138 NC_001138 Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 270161
REFSEQ_DNA:NC_001139 NC_001139 Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 1090940
REFSEQ_DNA:NC_001140 NC_001140 Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 562643
REFSEQ_DNA:NC_001141 NC_001141 Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 439888
REFSEQ_DNA:NC_001142 NC_001142 Saccharomyces cerevisiae S288c chromosome X, complete sequence. 745751
REFSEQ_DNA:NC_001143 NC_001143 Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 666816
REFSEQ_DNA:NC_001144 NC_001144 Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 1078177
REFSEQ_DNA:NC_001145 NC_001145 Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 924431
REFSEQ_DNA:NC_001146 NC_001146 Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 784333
REFSEQ_DNA:NC_001147 NC_001147 Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 1091291
REFSEQ_DNA:NC_001148 NC_001148 Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 948066

Также было получено подробное описание XI хромосомы того же организма, приведенное в таблице 2.

Таблица 1. Описание XI хромосомы Saccharomyces cerevisiae
Параметр Значение
XI
Длина 666816
Количество гнов белков 313
Количество генов тРНК 16

Для данной хромосомы было выбрано 4 гена, а именно: ген, который находится на прямой цепи и не имеет интронов; ген, который находится на обратной цепи и не имеет интронов; ген, который находится на прямой цепи и имеет хотя бы один интрон; ген, который находится на обратной цепи и имеет хотя бы один интрон. Информация о них приведена в таблице 3.

Таблица 3. Примеры генов XI хромосомы Saccharomyces cerevisiae
Тип Ген Координаты
Ген, который находится на прямой цепи и не имеет интронов MCH2 6107..7528
Ген, который находится на обратной цепи и не имеет интронов PAU16 complement(1810..2181)
Ген, который находится на прямой цепи и имеет хотя бы один интрон APE2 join(154991..155271,155655..158232)
Ген, который находится на обратной цепи и имеет хотя бы один интрон SFT1 complement(join(430198..430455,430597..430632))

Получение последовательности, кодирующей ABC-транспортерный периплазматический связывающий аминокислоты белок

Для работы был выдан идентификатор белка в базе данных NCBI Protein - YP_209034.1. С помощью сайта Uniprot был получен AC белка в базе данных Uniprot - Q5F5B5. По нему с помощью программы entret пакета EMBOSS получена полная запись Uniprot, откуда был найден AC записи EMBL, в которой описан ген ABC-транспортерного периплазматического связывающего аминокислоты белка - AE004969.

По AC белка в полной записи EMBL был найден ген, кодирующий данный белок. Это ген локуса NGO2014. Он имеет координаты 1985170..1986024 на прямой цепи.

Затем из записи EMBL быд вырезан фрагмент, содержащий последовательность гена, кодирующего ABC-транспортерный периплазматический связывающий аминокислоты белок. Последовательность в формате .fasta можно увидеть здесь

© Маслова Валентина, 2014
Последнее изменение: 13.10.2014