Занятие 4. Поиск гомологов некодирующей нуклеотидной последовательности

Задача - выбрать одну из тРНК кишечной палочки (Escherichia coli K-12) и найти наиболее похожую на нее последовательность в геноме архебактериии.

В отчете нужно привести все использованные команды в их окончательной версии!

  1. Определение того, какая тРНК была (скорее всего) использована рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи вашего белка.
  2. Таблица 1. Выбор тРНК

     Аминокислотный остаток в 4-ой позиции белка RIR1_ECOLI N
     Соответствующий кодон в гене nrdA 5'-AAT-3'
     Идеальный антикодон 5'-AUU-3'
     Сколько можно было бы ожидать разных тРНК для остатка X
    (если опираться на генетический код)?
     2
     Сколько тРНК для остатка N аннотировано в геноме кишечной палочки?  4
     Характеристика выбранной для дальнейшего изучения тРНК:
     название гена  asnT
     координаты гена в записи EMBL  2042573..2042648
     антикодон  5'-GUU-3'

    Команда, использованная для поиска всех аспарагиновых тРНК в геноме.
    
    grep anticodon.*Asn ecoli.embl > asn
    
    
    Результаты поиска в виде преформатированного текста.
    FT                   /anticodon=(pos:2042606..2042608,aa:Asn)
    FT                   /anticodon=(pos:2056091..2056093,aa:Asn)
    FT                   /anticodon=(pos:2057908..2057910,aa:Asn)
    FT                   /anticodon=(pos:2060317..2060319,aa:Asn)
    

  3. Поиск гомологичных тРНК в геноме архебактерии
  4. Задача - найти в геноме архебактерии последовательность, наиболее похожую на отобранную в упр. 1 последовательность тРНК из E.coli. Поиск был проведен в геноме Sulfolobus solfataricus с помощью 4-х разных программ, предназначенных для быстрого поиска сходных нуклеотидных последовательностей.

    Таблица 2. Поиск в геноме Sulfolobus solfataricus последовательностей, сходных с аспарагиновой тРНК E.coli

    Программа FastA BLASTN MegaBLAST Discontigous
    MegaBLAST
    Число находок с Е-value < 0,001  0  0  0  0
    Характеристика лучшей находки:
      E-value находки  0.012  0.59  0.59  -
      Номер сектора генома  12  233  233  -
      AC соответствующей записи EMBL  AE006653  AE006874  AE006874  -
      координаты выравниваний в записи EMBL  4302..4338  2890..2877  2890..2877  -
    Аннотация лучшей находки по EMBL
     tRNA-Lys  Hypothetical protein  Hypothetical protein  -
Список команд, использованных для выполнения задания:

seqret ecoli.embl -sask # с дальнейшим указанием начала и конца последовательности а также имени выходного файла trna 

formatdb -i ss_genome.fasta -p F -n ss

blastall -p blastn -d ss -i trna -o blastn

megablast -d ss -i trna2 -o megablast -W 14  # Если использовать значение W=28 (по умолчанию) находок будет 0.

fasta35 trna ss_genome.fasta

discontiguous MegaBLAST не нашел ни одной последовательности ни при какой возможной комбинации параметров.

Вернутся к списку протоколов


©:Сорокин Максим