на главную
назад

Поиск гомологов некодирующей нуклеотидной последовательности

Поиск тРНК 4-го аминокислотного остатка белка Rho_ecoli.

 Аминокислотный остаток в 4-ой позиции белка RHO_ECOLI Thr(T)
 Соответствующий кодон в гене RHO 5'-ACC-3'
 Идеальный антикодон 5'-GGU-3'
Количество тРНК для остатка T
4
Количество тРНК для остатка T, аннотированных в геноме кишечной палочки 4
 Характеристика выбранной для дальнейшего изучения тРНК:
 название гена thrT (locus_tag="b3979")
 координаты гена в записи EMBL 4173777..4173852
 антикодон GGU

Команда, использованная для поиска всех треониновых тРНК в геноме:
grep anticodon.*Thr ecoli.embl > thr
Результат поиска тРНК:

FT       /anticodon=(pos:262128..262130,aa:Thr)
FT      /anticodon=(pos:3421642..3421644,aa:Thr)
FT       /anticodon=(pos:4173444..4173446,aa:Thr)
FT        /anticodon=(pos:4173810..4173812,aa:Thr)

Выбрали ген, в который входит последний антикодон.
Последовательность гена thrT извлекали из генома E.coli командой:
seqret ecoli.embl -sask
далее отвечали на запросы программы:
Begin at position [start]: 4173777
End at position [end]: 4173852
Reverse strand [N]:
output sequence(s) [u00096.fasta]: thrT.fasta

Поиск в геноме Sulfolobus solfataricus последовательностей, сходных с треониновой тРНК E.coli

Для начала поиска были созданы индексные файлы по геному Sulfolobus solfataricus:
formatdb -i ss_genome.fasta -p F -n ss
а) поиск с помощью программы BLASTN:
команда:
blastall -p blastn -d ss -i thrT.fasta -o blastn_ss_res.txt
б) поиск с помощью программы MegaBLAST:
команда:
megablast -d ss -i thrT.fasta -W 10 -o megablastres.txt
в) поиск с помощью discontiguous MegaBLAST:
команда:
megablast -d ss -i thrT.fasta -W 11 -N 2 -t 16 -o dismegablastres.txt
г) поиск с помощью FastA:
команда:
fasta35 thrT.fasta ss_genome.fasta -O fastares.txt
Программа FastA BLASTN MegaBLAST Discontigous
MegaBLAST
Число находок с Е-value < 0,001 1 0 0 0
Характеристика лучшей находки:
  E-value находки 7.2e-05 0.037 0.038  
  Номер сектора генома 237 5 5  
  AC соответствующей записи EMBL AE006872 AE006646 AE006646  
  координаты выравнивания в записи EMBL 2103-2180 7723- 7742 7723- 7742  
Аннотация лучшей находки по EMBL
Аннотирована как тРНК треонина(tRNA-Thr) Аннотирована как тРНК аспарагина (tRNA-Asn) Аннотирована как тРНК аспарагина (tRNA-Asn)  

  • Как видно из результатов поиска, лучшую находку по всем параметрам (наибольшая длина выравнивания, наименьшее E-value)
    нашла программа FastA. Лучшая находка BLASTN и MegaBLAST "уступает" ей на несколько порядков (в смысле значения E-value).
    К тому же находка FastA аннотирована так же, как и данный ген E.coli (tRNA-Thr), а находка BLASTN и MegaBLAST, как тРНК аспарагина.

  • Ввиду того, что у программы FastA наименьший размер якоря (6 нуклеотидов), результат оказался более точным, так как
    поиск шел по похожим участкам длиной 6 н.о.( а не 11, как у BLASTN или 28 - MegaBlast), которых, конечно, больше. Кстати при
    задании длины слова 28 MegaBlast не нашел ничего, более "приличный" результат программы выдала при длине слова = 10.

  • DiscontigousMegaBLAST не нашел ничего, видимо потому, что имеет другой алгоритм (через паттерны), предназначенный для
    поиска практически идентичных гомологов.

  • Итак, для поиска гомологов нуклеотидных последовательностей больше всего подходит программа FastA. Программы BLASTN,
    MegaBlast, DiscontigousMegaBLAST предназначены для поиска идентичных или очень похожих последовательностей.

  • ©Ивин Юрий