Нуклеотдные банки данных


  

SRS

При помощи системы SRS был получен список хромосом Saccharomyces cerevisiae:
REFSEQ_DNA:NC_001134	NC_001134	Saccharomyces cerevisiae S288c chromosome II, complete sequence. 	813184	
REFSEQ_DNA:NC_001135	NC_001135	Saccharomyces cerevisiae S288c chromosome III, complete sequence. 	316620	
REFSEQ_DNA:NC_001136	NC_001136	Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 	1531933	
REFSEQ_DNA:NC_001137	NC_001137	Saccharomyces cerevisiae S288c chromosome V, complete sequence. 	576874	
REFSEQ_DNA:NC_001138	NC_001138	Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 	270161	
REFSEQ_DNA:NC_001139	NC_001139	Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 	1090940	
REFSEQ_DNA:NC_001140	NC_001140	Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 	562643	
REFSEQ_DNA:NC_001141	NC_001141	Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 	439888	
REFSEQ_DNA:NC_001142	NC_001142	Saccharomyces cerevisiae S288c chromosome X, complete sequence. 	745751	
REFSEQ_DNA:NC_001143	NC_001143	Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 	666816	
REFSEQ_DNA:NC_001144	NC_001144	Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 	1078177	
REFSEQ_DNA:NC_001145	NC_001145	Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 	924431	
REFSEQ_DNA:NC_001146	NC_001146	Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 	784333	
REFSEQ_DNA:NC_001147	NC_001147	Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 	1091291	
REFSEQ_DNA:NC_001148	NC_001148	Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 	948066	
 
Расмотрим хромосому номер XV. Ее длина равна 1091291 нуклеотидов, и в ней записано 569 генов и 20 тРНК.
Ниже приведены примеры генов этой хромосомы, находящихся на разных цепях и имеющих разное количество интронов.

Цепь Число интронов Название Координаты CDS
Прямая 0 BDS1 6175..8115
Обратная 0 PAU20 complement(11549..11911)
Прямая 1 RPL25 join(80348..80360,80775..81190)
Обратная 1 RPS19A complement(join(92026..92440,92831..92850))

EMBL

С помощью команды entret был найден идентиикатор записи EMBL о данном белке (аденилат киназа, P16304 - AC в UniProt). Команда:
entret sw:P16304
В полученном файле была найдена строка "DR EMBL", в которй записаны идентификаторы нескольких записей в EMBL о данном белке. Из приведенных идентификаторов выберем D00619 и запустим команду
entret embl:D00619
В полученном файле указаны координаты CDS гена рассматриваемого белка. Чтобу получить последовательность этого гена, нужно вырезать ее из полученного файла, это делается командой seqret:
seqret -sask
После запуска программы нужно указать начало и конец искомого участка, а также файл выдачи. Таким образом, был получен файл с последовательностью гена аденилат киназы.

Главная страница Первый семестр Второй семестр Третий семестр Обо мне Ссылки


© Марк Меерсон, 2013
Последнее обновление: 17.11.2013