searching of the RNA-coding genes in other organizm

На главную страницу третьего семестра

Поиск сходных нуклеотидных последовательной, не кодирующих белки

Задача: выбрать тРНК у кишечной палочки (Escherichia coli K-12) и найти наиболее похожую на нее последовательность в родственном геноме сенной палочки (Bacillus subtilis).

  1. Определение тРНК, использованной рибосомой при присоединении 4-ого аминокислотного остатка (изолейцина) к растущей цепи белка COAE_ECOLI

    Определил 4-й а/к остаток в белке COAE_ECOLI и соответствующий ему кодон в гене. По таблице стандартного генетического кода данной аминокислоте соответствует 3 кодона, то есть помимо кодона AUA 4-ю а/к моего белка могли бы кодировать также AUC и AUT. Далее через putty с помощью команды
    grep codon.*isoleucine ecoli.embl > codon.txt
    я нашел в файле генома ecoli.embl все упоминания о закодированных в нем изолейциновых тРНК. Затем требовалось только выбрать из списка подходящую строчку (с подходящей тРНК), найти полную информацию об этом гене через тектовый поиск и выделить через putty данную кодирующую нуклеотидную последовательность с помощью команды:
    seqret -sask1.
    При этом координаты требуемого участка вводились вручную, так же как и направление цепи - обратное (complement).
    Результаты приведены в таблице 1.


    Таблица 1. Выбор т-РНК  
     Аминокислотный остаток в 4-ой позиции белка COAE_ECOLI I/Ile/Isoleucine
      Соответствующий кодон в гене coaE (возможная вырожденная позиция подчеркнута) 5'-AUA-3'
      Идеальный антикодон (возможная вырожденная позиция подчеркнута) 5'-UAU-3'
      Сколько можно было бы ожидать разных тРНК для остатка I, если опираться на генетический код? 3: AUA, AUC, AUT.
      Сколько разных тРНК для остатка I аннотировано в геноме кишечной палочки? 5 (среди них имеются все три возможные типа)
      Характеристика выбранной для дальнейшего изучения тРНК:
          имя гена ileY
          локализация гена в геноме 2783784..2783859
          распознаваемый кодон AUA;
          антикодон CAU

    Результат поиска всех изолейциновых тРНК у Escherichia coli K-12:

    FT                   /note="codons recognized: AUY; anticodon: GAU isoleucine
    FT                   /note="codon recognized: AUA; anticodon: CAU; isoleucine
    FT                   /note="codon recognized: AUA; anticodon: CAU; isoleucine
    FT                   /note="codons recognized: AUY; anticodon: GAU isoleucine
    FT                   /note="codons recognized: AUY; anticodon: GAU isoleucine
    

  2. Поиск гомологичных тРНК в родственном геноме

    Теперь мы попробуем с помощью четырех разных программ провести поиск гомологов полученной в первом пункте последовательности в геноме родственного к исходному организма Bacillus subtilis.
    Для действия программ нам необходимы индексные файлы по геному сенной палочки, содержащемся в документе bs_genome.fasta. Для этого используем команду:
    formatdb -i bs_genome.fasta -p F -n bs.
    Результаты работы приведены в таблице 2.


    Таблица 2. Поиск гомологичных кодирующих участков в геноме родственного организма различными программами.

    Программа FASTA BLASTN MegaBLAST discontiguous MegaBLAST
    Длина якоря 6 11 28 11
    Результаты поиска В результате поиска мы получили наилучшую из всех программ находку по E-value и по длине выравнивания. Результат поиска можно посмотреть здесь. На выходе получили 6 локальных выравниваний, правда с относительно высоким E-value даже у лучшей находки. Программа ничего не обнаружила. Выходной файл можно смотреть здесь. Он содержит 2 локальных выпавнивания. Причем лучшая находка здесь идентична лучшей находке в выходе с программы BLASTN.
    Число находок с E-value < 0,01 1 1 0 1
    Характеристика лучшей находки:
          E-value 1.6e-11 2e-04 - 3e-06
          длина выравнивания 77 36 - 36
          вес выравнивания 61 bits 40.1 bits - 46.1
          координаты в геноме 11462..11538 158420..158455 - 158420..158455
    Аннотация лучшей находки по записи EMBL:
          имя гена trnO-Ile trnB-Met3 - trnB-Met3
          это тРНК? да да - да
          это тоже изолейциновая тРНК? да нет, метиониновая - нет, метиониновая

    Команды, использовавшиеся непосредственно для проведения поиска:

    1. BLASTN
      blastall -p blastn -d bs -i I_tRNA.fasta -o bs_tRNA_out
    2. MegaBLAST
      megablast -d bs -i I_tRNA.fasta -o megablast_out -D 2 -e 10
    3. discontiguous MegaBLAST
      megablast -d bs -i I_tRNA.fasta -o dis_megablast_out -D 2 -e 10 -W 11 -t 16 -N 1
      Сначала при поиске я установил параметр t на максимум (=21), чтобы повысить чувсвительность поиска, но при этом у меня ничего не обнаружилось. То же самое было и с t=18. Наконец, при t=16 в файле выдачи оказались 2 находки.
    4. FASTA
      fasta34 I_tRNA.fasta bs_genome.fasta 6
      (при использовании также необходимо вручную указывать ряд опций).

    Подводя итоги необходимо отметить, что только программа FASTA в полной мере справилась с поставленной задачей, хоть ее вравнивание по качеству и не самое лучшее. Программы BLASTN и discontiguous MegaBLAST также обнаружили гомологичные тРНК, но не той аминокислоты. Вообще от них ожидались результаты получьше. Программа MegaBLAST не приспособлена для решения такого типа задач, которой от нее требовали, и мы убеждаемся в этом по результатам поиска.


©Куликовский, Алексей