Занятие 4. Поиск гомологов некодирующей нуклеотидной последовательности

  1. Определите, какая тРНК была (скорее всего) использована рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи вашего белка.
  2. Таблица 1. Выбор тРНК

     Аминокислотный остаток в 4-ой позиции белка PHR_ECOLI

    H

     Соответствующий кодон в гене phr

    5'-CAU-3'

     Идеальный антикодон

    5'-AUG-3'

     Сколько можно было бы ожидать разных тРНК для остатка H
    (если опираться на генетический код)?

    2

     Сколько тРНК для остатка H аннотировано в геноме кишечной палочки?

    1

     Характеристика выбранной для дальнейшего изучения тРНК:
     название гена

    HisR

     координаты гена в записи EMBL

    3980532..3980608

     антикодон

    GUG

    grep 'anticodon.*His' ecoli.embl > anticodon

              FT                   /anticodon=(pos:3980566..3980568,aa:His)

  3. Поиск гомологичных тРНК в геноме архебактерии
  4. Таблица 2. Поиск в геноме Sulfolobus solfataricus последовательностей, сходных с  <гистидиновой>  тРНК E.coli

    Программа FastA BLASTN MegaBLAST Discontigous
    MegaBLAST
    Число находок с Е-value<0,001 0 0 0 0
    Характеристика лучшей находки:
      E-value находки 0.024 0.59 0.6 нет
      Номер сектора генома 58 258 258 нет
      AC соответствующей записи EMBL AE006699 AE006899 AE006899 нет
      координаты выравнивания(-ий) в записи EMBL 3408...3485 (3409..3482 по данным srs) 7534..7547 7534..7547 нет
    Аннотация лучшей находки по EMBL
    (не аннотирована, аннотирована как тоже <гистидиновая> тРНК, как другая тРНК etc.)
    tRNA-Met не аннотирована не аннотирована не аннотирована

    distingouse Megablast не дает результатов (no hits found) пробовал все комбинации -N, -w и -t, а также разные параметры -e. Megablast дает результат, начиная с -W 14 и ниже.

    использованные команды:
    fasta35 tRNA.fasta ss_genome.fasta 6
    formatdb -i ss_genome.fasta -p F -n ss
    blastall -p blastn -d ss -i tRNA.fasta -e 10 -o trnablastnastn
    megablast -d ss -i tRNA.fasta -o mblastrna -D 2 -e 10 -W 14
    megablast -d ss -i tRNA.fasta -o mblastdrna -D 2 -e 10 -N * -W * -t * (* - разные комбинации)

    Вероятно, что наиболее похожая последовательность - это AE006699, участок 3408...3485 (3409..3482 по данным srs). Она аннотирована как tRNA и имеет самый низкий E-value, по сравнению с остальными. Другие являются гипотетическими белками.




    вернуться к 3 семестру