Программы пакета BLAST для работы с нуклеотидными последовательностями

  1. Поиск в геноме участков, кодирующих белки, похожие на заданный
  2. Для поиска в геноме бактерии P.multocida участков, кодирующих белки, похожие на рибосомальный белок rl7_ecoli воспользуемся программой TBLASTN. Индексные файлы создаются командой:
    formatdb -i pm_genome.fasta -p F -n pm
    Поиск производит программа:
    blastall -p tblastn -d pm -i rl7_ecoli.fasta -o outfile.txt -e 0.001
    Результаты выходного файла можно систематизировать следующим образом:
    Число находок с Е-value<0,001 1
    Характеристика лучшей находки:  
       E-value находки 4e-30
    AC соответствующей записи EMBL AE006211
    Координаты выравнивания в записи EMBL 4455-4757
    Координаты CDS в записи EMBL 4389-4757

  3. Аналогичный поиск сразу в нескольких геномах
  4. Используя те же программы найдём необходимые нуклеотидные последовательности сразу в трёх геномах. Выходной файл программы можно посмотреть здесь.
    Нашлось всего 3 последовательности, по одной из каждого генома, при чём у найденного нами ранее участка из P.multocida E-value снижается до 2e-29 и оказывается вторым среди других находок.

  5. Поиск гомологов с помощью программы BLASTN
  6. С помощью SRS был найден AC в банке EMBL для нуклеотидной последовательности, в которой закодирован необходимый белок, длина соответствующего экзона. Затем команде seqret embl:V00339 -sask был задан участок последовательности, соответсвующий этому экзону. В файле, который породила команда, сохранена fasta-последовательность выбранного участка.
    Теперь, используя команду blastall -p blastn -d all -i v00339.fasta -o homolog.txt -e 0.001, найдём гомологи исследуемого гена из E.coli. В аннотации фрагмента гена сказано, что в геноме Е.coli на опероне rpoBC гены rpoC и rpoB несут информацию о beta- и beta' -субъединицах РНК-полимеразы, а гены rplL (ген, с которым мы работаем), rlpJ, rplA и rplK - о рибосомальных белках большой субъединицы: L7/L12, L10, L1 L11 соответсвенно. В выходном файле программы найдено лишь 2 гомолога (в то время как tblastn находила 3 гомолога), не "признав" фрагмент из Xanthomonas campestris, но E-value лучшей находки значительно меньше: e-115. Нуклеотидное выравнивание в данном случае выглядит так:
    Query: 131  gcccggttgaagctgctgaagaaaaaactgaattcgacgtaattctgaaagctgctggcg 190 
                |||||| |||||||||||||||||||||||||||||||||||||||||||||||||||||     
    Sbjct: 2366 gcccggctgaagctgctgaagaaaaaactgaattcgacgtaattctgaaagctgctggcg 2425 
                                                                                 
                                                                                 
    Query: 191  ctaacaaagttgctgttatcaaagcagtacgtggcgcaactggcctgggtctgaaagaag 250 
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||     
    Sbjct: 2426 ctaacaaagttgctgttatcaaagcagtacgtggcgcaactggcctgggtctgaaagaag 2485 
                                                                                 
                                                                                 
    Query: 251  ctaaagacttggtagaatctgcaccggctgctctgaaagaaggcgtgagcaaagacgacg 310 
                |||||||| ||||||||||||| ||||| |||||||||||||||||||||||||| ||||     
    Sbjct: 2486 ctaaagacctggtagaatctgctccggccgctctgaaagaaggcgtgagcaaagatgacg 2545  
                                                                                 
                                                                                 
    Query: 311  cagaagcactgaaaaaagctctggaagaagctggcgctgaagttgaagttaaataa 366     
                | ||||||||||||||| ||||||||||||||||||||||||||||||||||||||         
    Sbjct: 2546 ctgaagcactgaaaaaatctctggaagaagctggcgctgaagttgaagttaaataa 2601      
    
    Query: 1    atgtctatcactaaagatcaaatcattgaagcagttgcagctatgtctgtaatggacgtt 60  
                |||||||||||||||||||||||||||||||||||  | |||||||| ||||||||||||     
    Sbjct: 2236 atgtctatcactaaagatcaaatcattgaagcagtatccgctatgtccgtaatggacgtt 2295  
                                                                                 
                                                                                 
    Query: 61   gtagaactgatctctgcaatggaagaaaaattcggtgtttcc 102                   
                ||||||||||| ||||||||||||||||||||||||||||||                       
    Sbjct: 2296 gtagaactgatttctgcaatggaagaaaaattcggtgtttcc 2337  

    Таким образом, можно заключить, что программа blastn хуже справляется с поиском гомологов, поскольку находит лишь близких родственников.
Назад

На главную


©Степанова Вита