Нуклеотидные банки данных

В банке RefSeq DNA (release) средствами SRS были найдены хромосомы Saccharomyces cerevisiae.

  
  REFSEQ_DNA:NC_001133	NC_001133	Saccharomyces cerevisiae S288c chromosome I, complete sequence. 	230218	
  REFSEQ_DNA:NC_001134	NC_001134	Saccharomyces cerevisiae S288c chromosome II, complete sequence. 	813184	
  REFSEQ_DNA:NC_001135	NC_001135	Saccharomyces cerevisiae S288c chromosome III, complete sequence. 	316620	
  REFSEQ_DNA:NC_001136	NC_001136	Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 	1531933	
  REFSEQ_DNA:NC_001137	NC_001137	Saccharomyces cerevisiae S288c chromosome V, complete sequence. 	576874	
  REFSEQ_DNA:NC_001138	NC_001138	Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 	270161	
  REFSEQ_DNA:NC_001139	NC_001139	Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 	1090940	
  REFSEQ_DNA:NC_001140	NC_001140	Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 	562643	
  REFSEQ_DNA:NC_001141	NC_001141	Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 	439888	
  REFSEQ_DNA:NC_001142	NC_001142	Saccharomyces cerevisiae S288c chromosome X, complete sequence. 	745751	
  REFSEQ_DNA:NC_001143	NC_001143	Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 	666816	
  REFSEQ_DNA:NC_001144	NC_001144	Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 	1078177	
  REFSEQ_DNA:NC_001145	NC_001145	Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 	924431	
  REFSEQ_DNA:NC_001146	NC_001146	Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 	784333	
  REFSEQ_DNA:NC_001147	NC_001147	Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 	1091291	
  REFSEQ_DNA:NC_001148	NC_001148	Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 	948066	

  
Рассматривалась XIV хромосома. Ее длина 784333 пар, в ней содержится 418 генов и 14 тРНК. Вот примеры 4 генов, находящихся на ней:

Для белка с Uniprot AC O31675 было получено EMBL AC AL009126; CAB13245.1 при помощи пакета emboss последовательными командами

  entret sw:O31675
  grep EMBL quec_bacsu.entret
  

Далее с помощью команды

	entret embl:CAB13245.1
	
был получен файл с полной записью EMBL. В нем был найден ген gene="queC" и определены границы кодирующего участка ("CDS"): 1439448..1440107. После этого с помошью команды seqret c параметром -sask была получена нуклеотидная последовательность QUEC:
  >CAB13245 CAB13245.1 Bacillus subtilis subsp. subtilis str. 168 pre-queuosine 0 synthase
  	 atgaaaaaagaaaaagcaattgtcgtatttagcggcggtcaagacagcacaacatgctta
     ctgtgggccttaaaagaattcgaagaagtcgaaacggtgacttttcattataatcagcga
     cattcgcaggaagttgaagtggcaaaatccattgcggaaaagcttggtgtgaaaaatcat
     ttgcttgatatgtcacttttaaatcagcttgcaccgaatgccctgactagaaatgatatt
     gagatagaagtaaaagacggcgaactgccatccacattcgttccaggccgcaatttggta
     ttcttatcctttgcgtctatcctggcttaccaaattggcgcgcgccacattattacagga
     gtttgcgagacagacttcagtggttatcctgactgccgtgacgaattcgtgaaatcttgc
     aatgtcacggtaaatctggcaatggagaagccgtttgtgatccacacgcctctcatgtgg
     ctcaataaggcggaaacgtggaagcttgcagatgagcttggcgcgctggattttgtgaaa
     aacaacacgctgacatgctataacggcatcatcgcagacggctgcggcgaatgtccggca
     tgtcaccttcgttcaaaaggttatgaagaatatatggtgatgaaaggagagcgtgcataa
   

© Ляпунов Александр, 2012. 2012.       Дата последнего изменения: 11.05.2013