Занятие 4. Поиск гомологов некодирующей нуклеотидной последовательности

  1. Определение, какая тРНК была (скорее всего) использована рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи вашего белка.
  2. :

    Таблица 1. Выбор тРНК

     Аминокислотный остаток в 4-ой позиции белк YAHK_ECOLI K
     Соответствующий кодон в гене yahK 5'-AAA-3'
     Идеальный антикодон 5'-UUU-3'
     Сколько можно было бы ожидать разных тРНК для остатка K
    (если опираться на генетический код)?
    2
     Сколько тРНК для остатка K аннотировано в геноме кишечной палочки? 6
     Характеристика выбранной для дальнейшего изучения тРНК:
     название гена lysV
     координаты гена в записи EMBL 2519275..2519350
     антикодон 5'-UUU-3'

    Команда, использованная для поиска всех лизиновых тРНК в геноме.

    grep "anticodon.*Lys" ecoli.embl > antilys

    результаты поиска в виде преформатированного текста.

    FT                   /anticodon=(pos:779810..779812,aa:Lys)
    FT                   /anticodon=(pos:780099..780101,aa:Lys)
    FT                   /anticodon=(pos:780403..780405,aa:Lys)
    FT                   /anticodon=(pos:780625..780627,aa:Lys)
    FT                   /anticodon=(pos:780833..780835,aa:Lys)
    FT                   /anticodon=(pos:2519308..2519310,aa:Lys)
      

    Выбрали антикодон

    /anticodon=(pos:2519308..2519310,aa:Lys)

    Вырезание t-RNK:

    seqret -sask ecoli.embl

    Выходной файл : u00096.fasta

     

     

  3. Поиск гомологичных тРНК в геноме архебактерии
  4. Таблица 2. Поиск в геноме Pyrococcus furiosus последовательностей, сходных с лизиновой   тРНК E.coli

    Программа FastA BLASTN MegaBLAST Discontigous
    MegaBLAST
    Число находок с Е-value < 0,001 3 0 0 -
    Характеристика лучшей находки:
      E-value находки 6.5e-08
    0.38
    0.38
    -
      Номер сектора генома 47 157 157 -
      AC соответствующей записи EMBL AE010172 AE010282 AE010282 -
      координаты выравнивания(-ий) в записи EMBL 475..552 1781 ... 1768
    1781 ... 1768 -
    Аннотация лучшей находки по EMBL
    (не аннотирована, аннотирована как тоже
    <аланиновая> тРНК, как другая тРНК etc.)
    tRNA-Lys hypothetical protein hypothetical protein -

.

Используемые команды:

BLASTN:

blastall -p blastn -d pf -i trnkseqret -o blastn

MegaBLAST:

megablast -d pf -i trnkseqret -o megablast14 -W 14

В параметре -W было выбрано значение 14, так как при больших значениях данного параметра находок нет

FAST(A):

fasta35 trnkseqret pf_genome.fasta 6


discontiguous MegaBLAST не нашел ни одной последовательности ни при какой возможной комбинации параметров.

Один из вариантов запроса в discontiguous MegaBLAST:

megablast -d pf -i trnkseqret -o dmegablast12_16_2 -W 12 -t16 -N 2

Выводы:
программы BLASTN, MegaBLAST и discontiguous MegaBLAST не подошли для поиска гомологов, так в первых двух случаях не было находок с Е-value < 0,001, в третьем же случае ни при каких параметрах находок не было. Скорее всего, данные программы не совсем предназначены для поиска гомологичных последовательностей. Программы FAST(A), наоборот, справилась с задачей. Скорее всего это связано с алгоритмом Смита- Ватермана, который подразумевает наличие матрицы замен (даже для 4 нуклеотидных оснований можно составить матрицу весов замен, по которой и будет считаться Score) и который содержиться только в программе FAST(A). Также на результат сказалась и длина слова: чем меньше слово, тем больше находок с Е-value < 0,001 - BLASTN :11, MegaBLAST:14, FAST(A):6

на главную