Банк RefSeq.Поисковая система SRS

Список хромосом дрожжей Saccharomyces cerevisiae:

REFSEQ_DNA:NC_001133	NC_001133	Saccharomyces cerevisiae S288c chromosome I, complete sequence. 	230218	
REFSEQ_DNA:NC_001134	NC_001134	Saccharomyces cerevisiae S288c chromosome II, complete sequence. 	813184	
REFSEQ_DNA:NC_001135	NC_001135	Saccharomyces cerevisiae S288c chromosome III, complete sequence. 	316620	
REFSEQ_DNA:NC_001136	NC_001136	Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 	1531933	
REFSEQ_DNA:NC_001137	NC_001137	Saccharomyces cerevisiae S288c chromosome V, complete sequence. 	576874	
REFSEQ_DNA:NC_001138	NC_001138	Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 	270161	
REFSEQ_DNA:NC_001139	NC_001139	Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 	1090940	
REFSEQ_DNA:NC_001140	NC_001140	Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 	562643	
REFSEQ_DNA:NC_001141	NC_001141	Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 	439888	
REFSEQ_DNA:NC_001142	NC_001142	Saccharomyces cerevisiae S288c chromosome X, complete sequence. 	745751	
REFSEQ_DNA:NC_001143	NC_001143	Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 	666816	
REFSEQ_DNA:NC_001144	NC_001144	Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 	1078177	
REFSEQ_DNA:NC_001145	NC_001145	Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 	924431	
REFSEQ_DNA:NC_001146	NC_001146	Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 	784333	
REFSEQ_DNA:NC_001147	NC_001147	Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 	1091291	
REFSEQ_DNA:NC_001148	NC_001148	Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 	948066
Информация о хромосоме IX:
  • Accession: NC_001141
  • Длина: 439888
  • Количество генов: 232
  • Количество генов тРНК: 10


  • Некоторые типы генов:
  • ген, который находится на прямой цепи и не имеет интронов
  • gene= VTH1 Gene ID: 854634 CDS: 11492..16141
  • ген, который находится на обратной цепи и не имеет интронов
  • gene= IMA3 Gene ID: 854635 CDS: complement(16784..18553)
  • ген, который находится на прямой цепи и имеет хотя бы один интрон
  • gene= RPL40A Gene ID: 854658 CDS: join(68708..68715,69150..69528)
  • ген, который находится на обратной цепи и имеет хотя бы один интрон gene= RPL16A Gene ID: 854673 CDS: join(98527..99095,99386..99416)

  • Получение последовательности, кодирующей белок PTHP_BACSU
  • При помощи команды entret sw: pthp_bacsu получили AC белка в EMBL
    AC EMBL: X12832 
  • При помощи поисковой программы SRS определяем границы гена и ориентацию на цепи
    CDS: 1118..1384
  • При помощи программы seqret -sask вырезаем нужный фрагмент последовательности ДНК из файла
    X12832

  • >X12832 X12832.1 Bacillus subtilis ptsX, ptsH and ptsI genes for enzyme III-glucose (EC 2.7.1.69), Hpr protein and enzyme I 
    (EC 2.7.3.9) of PEP:sugar phosphtransferase system
    atggcacaaaaaacatttaaagtaactgcagattctggaatccatgctcgtcctgcgaca
    gttcttgtacaaactgctagcaaatacgacgctgacgttaatttagaatataacggcaaa
    acagttaaccttaaatctattatgggtgttatgtctttaggtatcgctaaaggcgctgag
    atcacaatctctgcttccggagctgacgaaaacgatgctcttaacgctttagaagaaaca
    atgaaaagcgaaggactcggcgagtaa
    
     
    Выравнивание белков и их генов
    Для белка pthp_bacsu и его гомолога pthp_bacme провели выравнивание последовательностей белков программой needle:
    PTHP_BACSU         1 MAQKTFKVTADSGIHARPATVLVQTASKYDADVNLEYNGKTVNLKSIMGV     50
                         ||||||.|||||||||||||.|||.|||:|:|:|||:|||||||||||||
    PTHP_BACME         1 MAQKTFTVTADSGIHARPATTLVQAASKFDSDINLEFNGKTVNLKSIMGV     50
    
    PTHP_BACSU        51 MSLGIAKGAEITISASGADENDALNALEETMKSEGLGE     88
                         |||||.|||.|||||.|:||.|||.|||:||..|||||
    PTHP_BACME        51 MSLGIQKGATITISAEGSDEADALAALEDTMSKEGLGE     88
    
    
    Последовательность гена-гомолога pthp_bacme:
    >AJ005075 AJ005075.1 Bacillus megaterium ptsH and ptsI genes, complete CDSs
    atggcacaaaaaacatttacagtaacagcagactcaggaattcacgcacgtccagcaaca
    actttagtacaagcagcaagcaaatttgattctgatatcaacttagaattcaacggtaaa
    actgtaaacttaaaatcaatcatgggcgttatgtctttaggtattcaaaaaggcgctaca
    atcactatctctgcagaaggttctgacgaagcagatgcacttgctgctcttgaagataca
    atgagcaaagaaggattaggcgaataa
    
    Выравненные последовательности генов-гомоголов программой needle:
    X12832             1 atggcacaaaaaacatttaaagtaactgcagattctggaatccatgctcg     50
                         |||||||||||||||||||.||||||.|||||.||.|||||.||.||.||
    AJ005075           1 atggcacaaaaaacatttacagtaacagcagactcaggaattcacgcacg     50
    
    X12832            51 tcctgcgacagttcttgtacaaactgctagcaaatacgacgctgacgtta    100
                         |||.||.|||..|.|.||||||.|.||.|||||||..||..||||..|.|
    AJ005075          51 tccagcaacaactttagtacaagcagcaagcaaatttgattctgatatca    100
    
    X12832           101 atttagaatataacggcaaaacagttaaccttaaatctattatgggtgtt    150
                         |.|||||||..|||||.|||||.||.|||.|.|||||.||.|||||.|||
    AJ005075         101 acttagaattcaacggtaaaactgtaaacttaaaatcaatcatgggcgtt    150
    
    X12832           151 atgtctttaggtatcgctaaaggcgctgagatcacaatctctgcttccgg    200
                         ||||||||||||||....|||||||||...|||||.||||||||....||
    AJ005075         151 atgtctttaggtattcaaaaaggcgctacaatcactatctctgcagaagg    200
    
    X12832           201 agctgacgaaaacgatgctcttaacgctttagaagaaacaatga--aaag    248
                         ..||||||||...|||||.|||...|||.|.|||||.|||||||  ||| 
    AJ005075         201 ttctgacgaagcagatgcacttgctgctcttgaagatacaatgagcaaa-    249
    
    X12832           249 cgaaggactcggcgag---    264
                          ||||||.|.|||||.   
    AJ005075         250 -gaaggattaggcgaataa    267
     
    Выравнивненные программой tranalign последовательности:
    >X12832 Bacillus subtilis ptsX, ptsH and ptsI genes for enzyme III-glucose (EC 2.7.1.69), Hpr protein and enzyme I (EC 2.7.3.9) of PEP:sugar phosphtransferase system
    atggcacaaaaaacatttaaagtaactgcagattctggaatccatgctcgtcctgcgaca
    gttcttgtacaaactgctagcaaatacgacgctgacgttaatttagaatataacggcaaa
    acagttaaccttaaatctattatgggtgttatgtctttaggtatcgctaaaggcgctgag
    atcacaatctctgcttccggagctgacgaaaacgatgctcttaacgctttagaagaaaca
    atgaaaagcgaaggactcggcgag
    >AJ005075 Bacillus megaterium ptsH and ptsI genes, complete CDSs
    atggcacaaaaaacatttacagtaacagcagactcaggaattcacgcacgtccagcaaca
    actttagtacaagcagcaagcaaatttgattctgatatcaacttagaattcaacggtaaa
    actgtaaacttaaaatcaatcatgggcgttatgtctttaggtattcaaaaaggcgctaca
    atcactatctctgcagaaggttctgacgaagcagatgcacttgctgctcttgaagataca
    atgagcaaagaaggattaggcgaa
     

    Выводы: Сравним выравнивания, полученные для генов с использованием двух разных программ. Заметим, что в needle высокое identity, возможно это связано с тем, что алфавит ДНК состоит из 4-х букв, а аминокислот из 20,поэтому лучше выравнивать белковые последовательности. Программа tranalign позволяет выравнивать гены на основе белковых выравниваний.
    Поиск в нуклеотидном банке NCBI по имени гена
    В качестве примера для запроса в NCBI выбрала ген дрожжей RPL16A.Заметим, что:
  • Найдено всего 90 результатов по данному запросу
  • Найдены записи, содержащие ген из Saccharomyces cerevisiae, Aspergillus nidulans, Arabidopsis thaliana, Candida orthopsilosis и других дрожжей, и в них содержится информация о полных геномах, mRNA, генах.
    © Boskhomdzhieva Baina, 2012