Занятие №4. Поиск гомологов некодирующей нуклеотидной последовательности

  1. Определение того, какая тРНК была (скорее всего) использована рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи белка TIG_ECOLI.
  2. Таблица 1. Выбор тРНК

     Аминокислотный остаток в 4-ой позиции белка TIG_ECOLI S
     Соответствующий кодон в гене tig 5'-TCA-3'
     Идеальный антикодон 5'-UGA-3'
     Сколько можно было бы ожидать разных тРНК для остатка S
    (если опираться на генетический код)?
     6: " TCT, TCC, TCA, TCG, AGT ,AGC"
     Сколько тРНК для остатка S аннотировано в геноме кишечной палочки?  Было найдено 5 генов со следующими антикодонами: GGA, UGA, GGA, CGA, GCU
     Характеристика выбранной для дальнейшего изучения тРНК:
     название гена  serT
     координаты гена в записи EMBL  1030848..1030935
     антикодон  5'- UGA-3'

    Были использованы команды :
    "	grep codon.*serine ecoli.embl>res.txt
    "	(чтобы получить записи о сериновой тРНК в документе res.txt) 
    "	seqret ecoli.embl -sask
    "	(чтобы извлечь последовательность нужной тРНК). 
    
        Последовательность найденной тРНК из записи EMBL:
    

    ggaagtgtggccgagcggttgaaggcaccggtcttgaaaaccggcgacccgaaagggttccagagttcgaatctctgcgcttccgcca

    
    
    
    
    Результаты поиска в виде преформатированного текста.
    FT                   /note="codons recognized: UCY; anticodon: GGA serine tRNA5;
    FT                   /note="codons recognized: UCD; anticodon: UGA serine tRNA1;
    FT                   /note="codons recognized: UCY; anticodon: GGA serine tRNA5;
    FT                   /note="codon recognized: UCG; anticodon: CGA serine tRNA2;
    FT                   /note="codons recognized: AGY; anticodon: GCU serine tRNA3;

  3. Поиск гомологичных тРНК в геноме архебактерии
  4. Таблица 2. Поиск в геноме Pyrococcus furiosus последовательностей, сходных с сериновой тРНК E.coli

    Программа FastA BLASTN MegaBLAST Discontigous
    MegaBLAST
    Число находок с Е-value < 0,001  4  0  ничего не найдено  ничего не найдено
    Характеристика лучшей находки:
      E-value находки  0.00012  1,8  ничего не найдено  ничего не найдено
      Номер сектора генома  128    ничего не найдено  ничего не найдено
      AC соответствующей записи EMBL   AE010233  AE010253  ничего не найдено  ничего не найдено
      координаты выравниваний в записи EMBL   5147...5233  1334...1346  ничего не найдено  ничего не найдено
    Аннотация лучшей находки по EMBL
     tRNA-Leu  не аннотирована  не аннотирована  не аннотирована

Исходя из данной таблицы, можно сделать вывод о том, что наиболее схожей последовательностью обладает AE010233, так как по сравнению с AE010253 у неё ниже e-value, + она аннотирована как tRNA-Leu. Видимо AE010253 является гипотетическим белком.

Список команд, использованных для выполнения задания:
o	formatdb -i pf_genome.fasta -n bs -p F
o	blastall -p blastn -d bs -i serT.fasta -o blastn.fasta
o	entret embl:AE010253 -auto
o	megablast -d bs -i serT.fasta -o megablast.fasta -F m -D 2
o	megablast -d bs -i serT.fasta -o dmegablast.fasta -t 16 -W 11 -N 1 -D 2