Занятие 3. Программы пакета BLAST для работы с нуклеотидными последовательностями

  1. Создание индексных файлов для программ пакета BLAST
  2. Индексные файлы созданы в моей рабочей директории

  3. Поиск в геноме участков, кодирующих белки, похожие на заданный
  4. Поиск гомологов TYPH_ECOLI Геном Salmonella typhimurium
    Число находок с Е-value<0,001 1
    Характеристика лучшей находки:  
       E-value находки 0.0
      AC соответствующей записи EMBL AE008915
      координаты выравнивания(-ий) в записи EMBL 99-1418
      Координаты CDS в записи EMBL (если они есть) 99..1421
      AC UniProt в записи EMBL (если есть) Q7CP66
      Изменение e-value при поиске в 3-х геномах 0.0
      Общее число находок при поиске в 3-хгеномах 1

  5. Аналогичный поиск сразу в нескольких геномах
  6. См.таблицу.

    Можно сделать вывод,что найден гомолог и он лучший, так как он найден с хорошим e-value не только по одному геному, но по трем геномам. Я сопоставила координаты одной единственной находки с координатими CDS генов, которые включают в себя данные выравнивания. Видно, что координаты практически совпадают с координатами CDS гена. Как видно из описания данного белка deoA , он выполняет похожую с белком TYPH функцию(thymidine phosphorylase ). Так что можно говорить о гомологичности этих двух белков.

  7. Поиск гомологов с помощью программы BLASTN
  8.    Наилучшее E-value это по прежнему 0.0. Само выравнивание:
     >AE008915 AE006468 |AE008915| Salmonella typhimurium LT2, section 219
                of 220 of the complete genome.
              Length = 21405
    
     Score = 1106 bits (558), Expect = 0.0
     Identities = 1110/1294 (85%)
     Strand = Plus / Plus
    
                                                                            
    Query: 2    tgtttctcgcacaagaaattattcgtaaaaaacgtgatggtcatgcgctgagcgatgaag 61
                ||||||||||||||||||||||||||||||| ||||||||||||||| |||| || ||||
    Sbjct: 100  tgtttctcgcacaagaaattattcgtaaaaagcgtgatggtcatgcgttgagtgacgaag 159
    
                                                                            
    Query: 62   aaattcgtttctttatcaacggtattcgcgacaacactatctccgaagggcagattgccg 121
                |||||||||||||||| || |||||||| ||||| |||||||| ||||||||||||||||
    Sbjct: 160  aaattcgtttctttattaatggtattcgtgacaatactatctctgaagggcagattgccg 219
    
                                                                            
    Query: 122  ccctcgcgatgaccattttcttccacgatatgacaatgcctgagcgtgtctcgctgacca 181
                |||| ||||||||||| ||||||||||||||||| ||||| |||||||| ||||||||||
    Sbjct: 220  ccctggcgatgaccatcttcttccacgatatgaccatgccggagcgtgtttcgctgacca 279
    
                                                                            
    Query: 182  tggcgatgcgagattcaggaaccgttctcgactggaaaagcctgcatctgaatggcccga 241
                |||||||||| ||||| || || || || ||||||||||||||| |||| ||||||||||
    Sbjct: 280  tggcgatgcgggattccggtactgtccttgactggaaaagcctgaatctcaatggcccga 339
    
                                                                            
    Query: 242  ttgttgataaacactccaccggtggcgtcggcgatgtgacttcgctgatgttggggccga 301
                |||| ||||| || || ||||| ||||| || || ||||| || |||||||||||||| |
    Sbjct: 340  ttgtcgataagcattcgaccggcggcgtaggggacgtgacgtctctgatgttggggccaa 399
    
                                                                            
    Query: 302  tggtcgcagcctgcggcggctatattccgatgatctctggtcgcggcctcggtcatactg 361
                |||| || ||||||||||| ||| | ||||||||||| |||||||||||||| ||||| |
    Sbjct: 400  tggtagcggcctgcggcggttatgtgccgatgatctccggtcgcggcctcggacataccg 459
    
                                                                            
    Query: 362  gcggtacgctcgacaaactggaatccatccctggcttcgacattttcccggatgacaacc 421
                ||||||||||||||||||||||| | ||||| |||||||| || |||||||| |||||||
    Sbjct: 460  gcggtacgctcgacaaactggaagcgatcccgggcttcgatatcttcccggacgacaacc 519
    
                                                                            
    Query: 422  gtttccgcgaaattattaaagacgtcggcgtggcgattatcggtcagaccagttcactgg 481
                ||||||||||||||||| ||||||| || ||||||||||| || || ||||| || || |
    Sbjct: 520  gtttccgcgaaattattcaagacgtgggtgtggcgattattgggcaaaccagctcgcttg 579
    
                                                                            
    Query: 482  ctccggctgataaacgtttctacgcgacccgtgatattaccgcaaccgtggactccatcc 541
                | ||||| || |||||||| ||||| ||||| ||||||||||| || |||||||| || |
    Sbjct: 580  caccggcggacaaacgtttttacgccacccgcgatattaccgcgacggtggactctattc 639
    
                                                                            
    Query: 542  cgctgatcaccgcctctattctggcgaagaaacttgcggaaggtctggacgcgctggtga 601
                |||||||||||| ||| || || || |||||||| || ||||| || || |||||||| |
    Sbjct: 640  cgctgatcaccggctccatcctcgccaagaaactggccgaagggcttgatgcgctggtaa 699
    
                                                                            
    Query: 602  tggacgtgaaagtgggtagcggcgcgtttatgccgacctacgaactctctgaagcccttg 661
                ||||||| ||||| || ||||||||||||||||| ||||| ||||| |||||||||||||
    Sbjct: 700  tggacgtaaaagtcggcagcggcgcgtttatgccaacctatgaactttctgaagcccttg 759
    
                                                                            
    Query: 662  ccgaagcgattgttggcgtggctaacggcgctggcgtgcgcaccaccgcgctgctcaccg 721
                | ||||||||||| |||||||| || ||||| || || ||||| || ||| || | ||||
    Sbjct: 760  ctgaagcgattgtcggcgtggcaaatggcgcgggagttcgcactacggcgttgttaaccg 819
    
                                                                            
    Query: 722  acatgaatcaggtactggcctccagtgcaggtaacgcggttgaagttcgtgaagcggtgc 781
                | ||||| ||||| ||||| || || || ||||||||||| ||||| |||||||| ||||
    Sbjct: 820  atatgaaccaggtgctggcttcaagcgccggtaacgcggtggaagtgcgtgaagccgtgc 879
    
                                                                            
    Query: 782  agttcctgacgggtgaatatcgtaacccgcgtctgtttgatgtcacgatggcgctgtgcg 841
                |||||||||| |||||||| || || |||||  ||||||| ||||| |||||||| ||||
    Sbjct: 880  agttcctgaccggtgaataccgcaatccgcgcttgtttgacgtcactatggcgctatgcg 939
    
                                                                            
    Query: 842  tggagatgctgatctccggcaaactggcgaaagatgacgccgaagcgcgcgcgaaattgc 901
                |||||||||||||||||||| | ||||||||||| |||||||||||||| || ||| |||
    Sbjct: 940  tggagatgctgatctccggccagctggcgaaagacgacgccgaagcgcgtgccaaactgc 999
    
                                                                            
    Query: 902  aggcggtgctggacaacggtaaagcggcagaagtctttggtcgtatggtagcggcacaaa 961
                ||||||||||||| ||||||||||||||||||||||||||||||||||| || || || |
    Sbjct: 1000 aggcggtgctggataacggtaaagcggcagaagtctttggtcgtatggtggccgcgcaga 1059
    
                                                                            
    Query: 962  aaggcccgaccgacttcgttgagaactacgcgaagtatctgccgacagcgatgctgacga 1021
                |||| || | ||| ||||||||||||||||  || ||  ||||||| || ||| |||  |
    Sbjct: 1060 aagggccaagcgatttcgttgagaactacgataaatacttgccgaccgccatgttgagca 1119
    
                                                                            
    Query: 1022 aagcagtctatgctgataccgaaggttttgtcagtgaaatggatacccgcgcgctgggga 1081
                |||| || ||||||||||||||||| ||| |||| | ||||||||| || ||||||||||
    Sbjct: 1120 aagcggtatatgctgataccgaagggtttatcagcgcaatggatacgcgtgcgctgggga 1179
    
                                                                            
    Query: 1082 tggcagtggttgcaatgggcggcggacgccgtcaggcatctgacaccatcgattacagcg 1141
                |||| || ||  | ||||||||||| || |||||||| ||||||||||| ||||||||||
    Sbjct: 1180 tggcggtcgtctcgatgggcggcggccgtcgtcaggcgtctgacaccattgattacagcg 1239
    
                                                                            
    Query: 1142 tcggctttactgatatggcgcgtctgggcgaccaggtagacggtcagcgtccgctggcgg 1201
                | |||||||| || ||||| ||||||||||||    | ||||| ||||| ||||||||||
    Sbjct: 1240 ttggctttaccgacatggcccgtctgggcgacagcatcgacgggcagcgcccgctggcgg 1299
    
                                                                            
    Query: 1202 ttatccacgcgaaagacgaaaacaactggcaggaagcggcgaaagcggtgaaagcggcaa 1261
                | || || || |||||||||  ||  ||||||||||||||||| || || ||||||||||
    Sbjct: 1300 tgattcatgccaaagacgaagccagttggcaggaagcggcgaaggccgtcaaagcggcaa 1359
    
                                                  
    Query: 1262 ttaaacttgccgataaagcaccggaaagcacacc 1295
                |||  |||| ||||||||| || | |||||||||
    Sbjct: 1360 ttatccttgacgataaagcgccagcaagcacacc 1393
    Обе программки (tblastn и blastn) в моем случае получили почти одинаковый результат-
    т.е. и e-value одинаковое, и кусочки найденного(только в первом случае- это аминокис-ая 
    последовательность, во втором- нуклеотидная).Но во втором случае в выравнивании 
    укоротилась последовательность(не 1320 [440*3], а 1294). Identity различается: в
    первом случае 89%, во втором- 85%.
    
См. Назад.