Третий семестр

Программы пакета BLAST для работы с нуклеотидными последовательностями

  • Создание индексных файлов для работы с локальными версиями программ семейства BLAST Создала в своей рабочей директории индексные файлы пакета BLAST для поиска по геномам холерного вибриона (Vibrio cholerae), синегнойной палочки (Pseudomonas aeruginosa), бактерии Pasteurella multocida. Команда:
     formatdb -i **_genome.fasta -p F -n pa 

  • Поиск в неаннотированном геноме генов, кодирующих белки, похожие на заданный
  • Определила, не закодированы ли похожие белки в неаннотированном геноме другого организма

    По результатам поиска заполнила таблицу.

    Поиск гомологов DPO3X_Ecoli Геном синегнойной палочки (Pseudomonas aeruginosa) Геном холерного вибриона (Vibrio cholerae) Геном бактерии Pasteurella multocida
    Характеристика лучшей находки:  
         E-value находки e-132 e-163 e-138
      координаты выравнивания(-ий)
    в записи генома
    10717-12658 1341-3306 10000-11068
    AC соответствующей записи EMBL AE004581 AE004187 AE006072
      Координаты CDS в записи EMBL нет данных 1341..3419 10000..12144
      AC UniProt в записи EMBL нет данных Q9KT51 Q9CNR3
    Число находок с Е-value<0,01
    3 4 4
    Поиск по всем трем геномам:  
    E-value лучшей находки e-163
    число находок с E-value < 0,01 10

    Таким образом были найдены похожие белки в неаннотированном геноме другого организма (число находок с Е-value<0,01), причем во всех геномах-9 находок, и в случае поиска по трем генома-10 находок. Можно говорить о 10 находках, т.к. они совпадают с выдачей при поиске по всем геномам.

  • Аналогичный поиск сразу в нескольких геномах
  • Создала в своей директории индексные файлы BLAST для поиска по всем трем геномам сразу. С помощью программы провела поиск по трем геномам. Результаты в последних 2-х строках таблицы. Число находок с E-value < 0,01 увеличилось. E-value лучшей находки не изменился.

  • Поиск гомологов с помощью программы BLASTN
  • Скоровала в свою рабочую директорию fasta-файл с гeном моего белка. Нашла (с помощью индексных файлов для 3-х геномов) гомологов этого гена в трёх геномах программой BLASTN. E-value лучшей находки 2e-36. Соответствующее выравнивание:
    >embl|AE004187|AE004187 Vibrio cholerae O1 biovar eltor str. N16961
                chromosome I, section 95 of 251 of the complete
                chromosome.
              Length = 10172
    
    Query: 175  gcgaaggggctaaactgcgaaaccggcattaccgcgacgccgtgcggcgtgtgcgataac 234
                ||||||||||| |||||||| || ||||| || || ||||| ||||||  ||| |  | |
    Sbjct: 1515 gcgaaggggctcaactgcgagacgggcataacggctacgccttgcggccagtgtgcaacc 1574
    
                                                                            
    Query: 235  tgtcgtgaaatcgagcaggggcgctttgtcgatctgattgaaatcgacgccgcctcgcgc 294
                ||||  ||||| || ||||| |||||||| |||||| | || || ||||| || || |||
    Sbjct: 1575 tgtcaagaaattgatcagggacgctttgtggatctgctcgagattgacgctgcatcacgc 1634
    
                                                                            
    Query: 295  accaaagttgaagatacccgcgacctgctggataacgtccagtacgctccggcgcgtggt 354
                |||||||| |||||||| ||||| || || || ||||| ||||||   || |||||||| 
    Sbjct: 1635 accaaagtggaagatacgcgcgagctactcgacaacgtgcagtacaaacctgcgcgtgga 1694
    
                                                                            
    Query: 355  cgtttcaaagtttatctgatcgacgaagtgcatatgctgtcgcgccacagctttaacgca 414
                || ||||||||||| |||||||| ||||| |||||||| ||||| |||||||| || || 
    Sbjct: 1695 cgcttcaaagtttacctgatcgatgaagttcatatgctctcgcgtcacagcttcaatgcg 1754
    
                                                                            
    Query: 415  ctgttaaaaacccttgaagagccgccggagcacgttaagtttctgctggcgacgaccgat 474
                ||  | ||||| |||||||||||||| ||| | || |||||| ||||||| || || |||
    Sbjct: 1755 ctactgaaaacgcttgaagagccgcctgagtatgtgaagtttttgctggcaaccactgat 1814
    
                                                                     
    Query: 475  ccacagaaattgccggtgacgattttgtcacgctgtctgcaatttcatctcaa 527
                ||||| ||  |||| ||||| || ||||| |||||| |||| || ||||||||
    Sbjct: 1815 ccacaaaagctgcctgtgaccatcttgtctcgctgtttgcagttccatctcaa 1867
    
    
    
    Идентичность выравнивания не велика, однако само выравнивание имеет довольно большую длинну, есть много, хотя и коротких участков полных совпадений. E-value довольно мало, наверное, можно считать, что гомолог найден.