Страница курса биоинформатики
Факультет биоинженерии и биоинформатики

Занятие 4. Поиск гомологов некодирующей нуклеотидной последовательности

  • Определите, какая тРНК была (скорее всего) использована рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи вашего белка.
  • Таблица 1. Выбор тРНК

     Аминокислотный остаток в 4-ой позиции белка MODE_ECOLI E
     Соответствующий кодон в гене modE 5'-GAA-3'
     Идеальный антикодон 5'-UUC-3'
     Сколько можно было бы ожидать разных тРНК для остатка E
    (если опираться на генетический код)?
    2 (GAA или GAG)
     Сколько тРНК для остатка E аннотировано в геноме кишечной палочки? 4
     Характеристика выбранной для дальнейшего изучения тРНК:
     название гена gltW
     координаты гена в записи EMBL complement(2727391..2727466)
     антикодон UUC

    Команда, использованная для поиска всех Glu-тРНК в геноме:
    grep 'anticodon.*Glu' ecoli.embl > anticod.txt
    Результат:
    FT                   /anticodon=(pos:2727430..2727432,aa:Glu)
    FT                   /anticodon=(pos:3941492..3941494,aa:Glu)
    FT                   /anticodon=(pos:4166429..4166431,aa:Glu)
    FT                   /anticodon=(pos:4207831..4207833,aa:Glu)
    
    Как видно из списка находок, подходят последние 4 РНК.
    Команда, использовавшаяся для извлечения последвательности тРНК из записи EMBL:
    seqret ecoli.embl -sbegin 225381 -send 225457
    Описание тРНК в ecoli.embl
    FT   gene            complement(2727391..2727466)
    FT                   /gene="gltW"
    FT                   /locus_tag="b2590"
    FT                   /note="synonyms: ECK2588, JWR0053"
    FT   tRNA            complement(2727391..2727466)
    FT                   /gene="gltW"
    FT                   /locus_tag="b2590"
    FT                   /product="tRNA-Glu"
    FT                   /anticodon=(pos:2727430..2727432,aa:Glu)
    FT                   /note="codons recognized: GAR; anticodon: UUC glutamate
    FT                   tRNA2; go_component: cytoplasm [goid 0005737]; go_process:
    FT                   tRNA metabolism [goid 0006399]" 

  • Поиск гомологичных тРНК в геноме архебактерии
  • Таблица 2. Поиск в геноме Pyrococcus furiosus последовательностей, сходных с глутаматовой тРНК E.coli


    Проводился поиск в геноме архебактерии Pyrococcus furiosus (файл pf_genome.fasta) с помощью 4-х разных программ, предназначенных для быстрого поиска похожих нуклеотидных последовательностей: BLASTN, MegaBLAST, FastA и Discontigous MegaBLAST. Команды:
    - для создания базы данных по геному Sulfolobus solfataricus:
    
    formatdb -i pf_genome.fasta -n pf -p F 
    
    - для получения данных работы программы BLASTN:
    
    blastall -p blastn -d pf -i tRNA.fasta -o blastn.fasta 
    
    - для получения данных работы программы MEGABLAST:
    
    megablast -d ss -i ileV.fasta -e 0.1 -o megablastl -D 2 -W 11
    
    - для получения данных работы программы discontiguous MEGABLAST:
    
    megablast -d ss -i ileV.fasta -o dmegablastl -D 2 -W 11 -t 16 -N 2
    
    - для получения данных работы программы fasta35
    
    fasta35 tRNA.fasta pf_genome.fasta
    
    Программа FastA BLASTN MegaBLAST Discontigous
    MegaBLAST
    Число находок с Е-value < 0,001 6 - - -
    Характеристика лучшей находки:
      E-value находки 1.9e-06 0.096 0.096 -
      Номер сектора генома   159 (32) 159 (32) -
      AC соответствующей записи EMBL AE010284 AE010284 (AE010157) AE010284 (AE010157) -
      координаты выравнивания(-ий) в записи EMBL 4065...4138 4126...4112 (710...724) 4126...4112 (710...724) -
    Аннотация лучшей находки по EMBL
    /product="tRNA-Val"
    /note="tRNA Val anticodon TAC"
    /product="tRNA-Val"
    /note="tRNA Val anticodon TAC"

    (hypothetical protein)
    /product="tRNA-Val"
    /note="tRNA Val anticodon TAC"

    (hypothetical protein)
    -

    Только программа Fasta нашла последовательности с e-value мешьше 0,001, это можно объяснить тем, что у нее несколько другой алгоритм поиска. Остальные программы вообще не выдали находок с достойным e-value. Однако, в списке лучших находок у всех (кроме DiscontigousMegaBLAST) присутствует AE010284, но у BLASTN и MegaBLAST она имеет слишком большое e-value: 0.096 (существенно уменьшилась длина выравнивания). DiscontigousMegaBLAST гомологов не нашел.



    Переход на главную страницу

    © Суворова Анастасия