Нуклеотидные банки данных

Задание 1: Знакомство со структурой банка RefSeq посредством поисковой системы SRS

Выдача поисковой системы SRS на запрос о хромосомах дрожжей Saccharomyces cerevisiae

REFSEQ_DNA:NC_001133	DNA linear	
REFSEQ_DNA:NC_001134	DNA linear	
REFSEQ_DNA:NC_001135	DNA linear	
REFSEQ_DNA:NC_001136	DNA linear	
REFSEQ_DNA:NC_001137	DNA linear	
REFSEQ_DNA:NC_001138	DNA linear	
REFSEQ_DNA:NC_001139	DNA linear	
REFSEQ_DNA:NC_001140	DNA linear	
REFSEQ_DNA:NC_001141	DNA linear	
REFSEQ_DNA:NC_001142	DNA linear	
REFSEQ_DNA:NC_001143	DNA linear	
REFSEQ_DNA:NC_001144	DNA linear	
REFSEQ_DNA:NC_001145	DNA linear	
REFSEQ_DNA:NC_001146	DNA linear	
REFSEQ_DNA:NC_001147	DNA linear	
REFSEQ_DNA:NC_001148	DNA linear	

Примеры нескольких генов на пятой хромосоме дрожжей:

1. Ген RMD6
Находится на прямой цепи, не содержит интронов. CDS координаты 13720..14415
2. Ген HXT13
Находится на обратной цепи, не содержит интронов. CDS координаты complement(21537..23231)
3. Ген UBC8
Находится на прямой цепи, содержит один интрон. CDS координаты join(131772..131776,131900..132551)
2. Ген PMI40
Находится на обратной цепи, содержит один интрон. CDS координаты complement(join(157736..158994,159088..159118))

Задание 2: Получение последовательности, кодирующей заданный белок

С помощью команды entret sw:54512, где 54512 id белка в базе данных SwissProt, нашли АС записи в EMBL - D84432.

Командой entret embl:D84432 определяем CDS координаты гена: 175737..176165. Ген находится на прямой цепи.
Затем выясняем последовательность гена командой seqret d84432.entret -sask. Полученную последовательность гена можно посмотреть тут.


© Ходыкина Наталья,2013