Нуклеотидные банки данных

Задание 1. Знакомство со структурой банка RefSeq посредством поисковой системы SRS.

a. Cписок хромосом дрожжей Saccharomyces cerevisiae:

REFSEQ_DNA:NC_001133	NC_001133	Saccharomyces cerevisiae S288c chromosome I, complete sequence. 	230218	
REFSEQ_DNA:NC_001134	NC_001134	Saccharomyces cerevisiae S288c chromosome II, complete sequence. 	813184	
REFSEQ_DNA:NC_001135	NC_001135	Saccharomyces cerevisiae S288c chromosome III, complete sequence. 	316620	
REFSEQ_DNA:NC_001136	NC_001136	Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 	1531933	
REFSEQ_DNA:NC_001137	NC_001137	Saccharomyces cerevisiae S288c chromosome V, complete sequence. 	576874	
REFSEQ_DNA:NC_001138	NC_001138	Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 	270161	
REFSEQ_DNA:NC_001139	NC_001139	Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 	1090940	
REFSEQ_DNA:NC_001140	NC_001140	Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 	562643	
REFSEQ_DNA:NC_001141	NC_001141	Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 	439888	
REFSEQ_DNA:NC_001142	NC_001142	Saccharomyces cerevisiae S288c chromosome X, complete sequence. 	745751	
REFSEQ_DNA:NC_001143	NC_001143	Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 	666816	
REFSEQ_DNA:NC_001144	NC_001144	Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 	1078177	
REFSEQ_DNA:NC_001145	NC_001145	Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 	924431	
REFSEQ_DNA:NC_001146	NC_001146	Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 	784333	
REFSEQ_DNA:NC_001147	NC_001147	Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 	1091291	
REFSEQ_DNA:NC_001148	NC_001148	Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 	948066	

b. Информация о хромосоме номер 13:

Длина хромосомы: 924431 BP
Количество генов: 496
Количество тРНК: 21

c. Примеры отдельных генов:

  • ген на прямой цепи и не имеет интронов: gene="COS12" 2090..3932,
  • ген на обратной цепи и не имеет интронов: gene="PAU11" complement(6290..6652),
  • ген на прямой цепи и имеет хотя бы один интрон: gene="YRF1-3" join(1084864..1084882,1085031..1090591)
  • ген на обратной цепи и имеет хотя бы один интрон: gene="HFM1" complement(join(27921..31426,31579..31636))

Задание 2. Получение последовательности, кодирующей заданный белок.

Данное задание было выполнено для белка HUTU_BACSU. Используя команду entret sw:hutu_bascu (где hutu_bascu – AC белка в Swiss-Prot), получаем файл и находим AC записи EMBL.
AC EMBL: D31856.
Используя команду entret embl:D31856 получаем полный файл с записью EMBL и находим границы кодирующего участка.
CDS complement(4094..5752).
Используя команду seqret -sask, вырезаем участок, кодирующий данный белок, в отдельный файл.


© Наталья Ланина
e-mail: n.lanina@fbb.msu.ru