Занятие 4. Поиск гомологов некодирующей нуклеотидной последовательности

    #1 Определение тРНК, использованой рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи белка DHAS_ECOLI

    В четвертой позиции в моем белке стоит валин. Из таблицы генетического кода следует, что третья позиция вырожденная.

     Аминокислотный остаток в 4-ой позиции белка MALK_ECOLI Val
     Соответствующий кодон 5'-GTT-3'
     Идеальный антикодон 5'-AAC-3'
     Сколько можно было бы ожидать разных тРНК для остатка Val
    (опираясь на генетический код)
    4
     Сколько тРНК для остатка Val аннотировано в геноме кишечной палочки? 7
     Характеристика выбранной для дальнейшего изучения тРНК:
      Название гена valT
      Координаты гена в записи EMBL 780021..780023
      Антикодон UAC

    Команда, использованная для поиска всех валиновых тРНК в геноме:
    grep "anticodon.*valine" ecoli.embl > result

    Содержание полученного файла:
    FT /note="codons recognized: GUD; anticodon: UAC valine tRNA1;
    FT /note="codons recognized: GUD; anticodon: UAC valine tRNA1;
    FT /note="codons recognized: GUY; anticodon: GAC valine
    FT /note="codons recognized: GUY; anticodon: GAC valine
    FT /note="codons recognized: GUD; anticodon: UAC valine tRNA1;
    FT /note="codons recognized: GUD; anticodon: UAC valine tRNA1;
    FT /note="codons recognized: GUD; anticodon: UAC valine tRNA1;

    Идеального антикодона в выдаче нет. Думаю это связан ос вырожденностью третьей позиции кодона (соответственно первая позиция антикодона).

    Содержание описания в ecoli.embl:
    FT tRNA 779988..780063
    FT /gene="valT"
    FT /locus_tag="b0744"
    FT /product="tRNA-Val"
    FT /anticodon=(pos:780021..780023,aa:Val)
    FT /note="codons recognized: GUD; anticodon: UAC valine tRNA1;
    FT go_component: cytoplasm [goid 0005737]; go_process: tRNA
    FT metabolism [goid 0006399]"


    Команда, использовавшаяся для извлечения последвательности тРНК из записи EMBL:
    seqret ecoli.embl -sask

    #2 Поиск гомологичных тРНК в геноме архебактерии

    Программа  
    FastA
    BLASTN
    MegaBLAST
    Discontigous MegaBLAST
    Число находок с Е-value < 0,001   0 0 0 0
    Характеристика лучшей находки:
      E-value находки   0.013 2.3 2.3 2.3
      Номер сектора генома     148 148 148
      AC соответствующей записи EMBL   AE006707 AE006789 AE006789 AE006789
      координаты выравнивания(-ий) в записи EMBL   7341-7401 1269 - 1281 1269 - 1281 1269 - 1281

    Поиск гомологов тРНК валина бактерии Escherichia coli в геноме Sulfolobus solfataricus не дал результатов. Т.к. ни одна из представленных в этой работе программ BLAST и программа fastA не предназначены для этого. Они работают со словами большой длины, не имеют матриц замен (за исключением fastA), что осложняет поиск гомологичных нуклеотидных последовательностей. Ситуация усугубляется тем что исследуется геном археобактерии. Ни одна из представленных программ не позволяет находить отдаленных гомологов.