Занятие 4. Поиск гомологов некодирующей нуклеотидной последовательности

  • Определение того, какая тРНК была (скорее всего) использована рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи вашего белка.
  • Таблица 1. Выбор тРНК

     Аминокислотный остаток в 4-ой позиции белка PABB_ECOLI Leu
     Соответствующий кодон в гене pabB 5'-UUA-3'
     Идеальный антикодон 5'-UAA-3'
     Сколько можно было бы ожидать разных тРНК для остатка L
    (если опираться на генетический код)?
     6
     Сколько тРНК для остатка L аннотировано в геноме кишечной палочки?  6
     Характеристика выбранной для дальнейшего изучения тРНК:
     название гена   leuT
     координаты гена в записи EMBL  3980629..3980715
     антикодон  5'-CAG-3'

    Команда, использованная для поиска всех лейциновых тРНК в геноме.
    grep "anticodon.* leu" ecoli.embl > leu
    
    
    Результаты поиска в виде преформатированного текста.
    FT                   /note="codons recognized: CUR; anticodon: UAG leucine
    FT                   /note="codons recognized: UUR; anticodon: UAA leucine
    FT                   /note="codons recognized: CUY; anticodon: GAG leucine
    FT                   /note="codon recognized: CUG; anticodon: CAG leucine tRNA1;
    FT                   /note="codons recognized: UUR; anticodon: CAA leucine
    FT                   /note="codon recognized: CUG; anticodon: CAG leucine tRNA1;
    FT                   /note="codon recognized: CUG; anticodon: CAG leucine tRNA1;
    FT                   /note="codon recognized: CUG; anticodon: CAG leucine tRNA1; 
    
    Не смотря на то, что последние три тРНК одинаковы как по разпознаваемому кодону, так и по антикодону, они закодированы в разных локусах хромосомы,поэтому будем считать, что аннотировано всего 8 лейциновых тРНК.

  • Поиск гомологичных тРНК в геноме архебактерии
  • Таблица 2. Поиск в геноме Pyrococcus furiosus последовательностей, сходных с лейциновой тРНК E.coli

    Программа FastA BLASTN MegaBLAST Discontigous
    MegaBLAST
    Число находок с Е-value < 0,001  3  0  0  0
    Характеристика лучшей находки:
      E-value находки  0.00027  0.44  0.44  -
      Номер сектора генома  139  141  141  -
      AC соответствующей записи EMBL  AE010264  AE010266  AE010266  -
      координаты выравниваний в записи EMBL  46..134  828..815  828..815  -
    Аннотация лучшей находки по EMBL
     tRNA-Leu  Hypothetical protein  Hypothetical protein  -
    Список команд, использованных для выполнения задания:
    seqret ecoli.embl -sask # файл leuT
    
    formatdb -i pf_genome.fasta -p F -n pf
    
    blastall -p blastn -d pf -i leuT -o blastn
    
    megablast -d pf -i leuT -o megablast -W 14  # Со значением W=28 (по умолчанию) ничего не находит, вероятно "слово" слишком длинное.
    
    fasta35 leuT pf_genome.fasta
    
    
    Discontiguous MegaBLAST не нашел ни одной последовательности( никакие комбинации параметров не подходят)

    Выводы:

    Как видно из таблицы, FASTA35 лучше всего справилась с заданием(по результатам поиска с E-value <0.001). Вероятно, такой результат достигается засчет маленькой длины "слова"(6). Кодирующая последовательность тРНК довольно мала(порядка нескольких сот нуклеотидов),поэтому такая длина "слова" оптимальна. В программах типа "BLAST" "слова" длиннее, что, в данном конкретном случае лишь мешает поиску гомологичных последовательностей. + В файле с результатами FASTA35 говорится об алгоритме Смита-Вотермана, который подразумевает наличие матриц весов замен, который также мог оказать влияние на конечный результат.

    На главную страницу >>>


    © Гурьянова Наталья Николаевна