на главную страницу

Поиск сходных нуклеотидных последовательной, не кодирующих белки


  • Была выполнена команда: "grep -n "codon.*cysteine" ecoli.embl>result.txt" при этом был получен файл с одной строчкой, где были указаны кодоны и антикодоны. Далее извлекаем последовательность с помощью команды: "seqret ecoli.embl -sask"(при этом пришлось указать начало и конец последовательности, а также имя выходящего файла).
     Аминокислотный остаток в 4-ой позиции белка DCD_ECOLI C(Cysteine)
      Соответствующий кодон в гене dcd 5'-ACA-3'(complement)
      Идеальный антикодон 5'-ACA-3'
      Сколько можно было бы ожидать разных тРНК для остатка C, если опираться на генетический код? 2
      Сколько разных тРНК для остатка C аннотировано в геноме кишечной палочки? 1
      Характеристика выбранной для дальнейшего изучения тРНК:
          имя гена cysT
          локализация гена в геноме complement(1989938..1990011)
          распознаваемый кодон UGY
          антикодон GCA
    Результат поиска всех цистеиновых тРНК у Escherichia coli K-12
    45089:FT                   /note="codons recognized: UGY; anticodon: GCA cysteine
  • BLASTN:Сначала получаем индексные файлы для Bacillus subtilis(formatdb -i bs_genome.fasta -p F -n bs), далее провели поиск(blastall -p blastn -i tRNA.fasta -d bs -o result44.txt).
  • Megablast:megablast -d bs -i tRNA.fasta -o result44mega.txt -D 2
  • discontiguous MegaBLAST:megablast -d bs -i tRNA.fasta -o result44dis.txt -D 2 -W 11 -t 21 -N 1
  • fasta:fasta34(при этом пришлось ввести имя файла с последовательностью, файла-библиотеки, имя выходящего файла, число выравниваний).
    Программа FASTA BLASTN MegaBLAST discontiguous MegaBLAST
    Длина якоря 6 11 28 11
    Результаты поиска fasta.txt, было выведено 4 выравнивания. blastn.txt, было построено одно выравнивание. mega.txt,ничего не найдено. dismega.txt,найдено 1 выравнивание.
    Число находок с E-value < 0,01 0 0   0
    Характеристика лучшей находки:
          E-value 0.074 0.20   48
          длина выравнивания 74 15   11
          вес выравнивания 24.4 30   22
          координаты в геноме 7099-7173 3695038-3695024   3191145-3191155
    Аннотация лучшей находки по записи EMBL:
          имя гена gyrA ywtE    yubD
          это тРНК? нет нет   нет
          это тоже цистеиновая тРНК? нет нет   нет

    Результаты в принципе не очень хорошие. Программа MegaBLAST сработала хуже всего,так как не нашло ни одного выравнивания. discontiguous MegaBLAST и BLASTN нашли по одному выравниванию, но E-value выравнивания в discontiguous MegaBLAST равно 48, что делает выравнивание не очень значимым, в отличие от BLASTN, где E-value равно 0.20. Ну и самым лучшим оказалось FASTA. С помощью этой программы были найдены 4 выравнивания, причём E-value лучшего равно 0.074.


    ©Дёмин Олег