Поиск сходных нуклеотидных последовательной, не кодирующих белки.

На главную страницу третьего семестра 

 

Определение транспортной RNA, которая используется рибосомой при присоедении четвёртого аминокислотного остатка к растущей цепи ДНК-полимеразы I.

Таблица 1. Выбор т-РНК
 Аминокислотный остаток в 4-ой позиции белка ASSY_ECOLI I (изолейцин)
 Соответствующий кодон в гене argG 5'-ATT-3' (Соответственно в RNA кодон 5'-AUU-3'. Третья позиция, которую занимает тимин, является вырожденной, т.к. вместо тимина может стоять аденин или цитозин.
  Идеальный антикодон. 5'-AAU-3'
  Сколько можно было бы ожидать разных tRNA для остатка I, если опираться на генетический код? Можно было бы ожидать 3 разных tRNA, т.к. в генетическом коде изолейцин кодируется тремя вариантами : ATT, ATC, ATA. 
  Сколько разных tRNA для остатка I аннотировано в геноме кишечной палочки? Для кишечной палочки аннотировано только 2 tRNA: - с антикодоном 5'-GAU-3' - GAU изолейциновая tRNA1 - с антикодоном 5'-CAU-3' - CAU изолейциновая tRNA2 

       Характеристика выбранной для дальнейшего изучения
tRNA:
      имя гена       локализация гена в геноме       распознаваемый кодон       антикодон
ileV 225381-225457 нуклеотиды 5'-AUC-3' 5'-СAU-3'
ileU 3425098-3425174 нуклеотиды (комплементарная цепь) 5'-AUC-3' 5'-СAU-3'
ileT 4035164-4035240 нуклеотиды 5'-AUC-3' 5'-СAU-3'

Результат поиска всех изолейциновых tRNA у Escherichia coli K-12

FT                   /note="codons recognized: AUY; anticodon: GAU isoleucine
FT                   /note="codon recognized: AUA; anticodon: CAU; isoleucine
FT                   /note="codon recognized: AUA; anticodon: CAU; isoleucine
FT                   /note="codons recognized: AUY; anticodon: GAU isoleucine
FT                   /note="codons recognized: AUY; anticodon: GAU isoleucine
Команды, использованные при выполнении задания. - grep "codon.*isoleucine" ecoli.embl >result.txt Был получен файл, в котором имелось 5 строк, они являются аннотациями соответствующего гена. По ним было быстро получена вся интересная нам информация. - seqret -sask ecoli.embl Был получен файл с последовательностью tRNA.

Поиск гомологов изолейциновой tRNA в геноме Bacillus subtilis.

Таблица 2. Поиск гомологичной tRNA.
Программа FASTA34 BLASTN MegaBLAST discontiguous MegaBLAST
Длина якоря 6 нуклеотидов 11 нуклеотидов 28 нуклеотидов 11 (или 12) нуклеотидов (берутся только значимые)
Результаты поиска fas.txt
Результат, который выдала программа FASTA отличается от поисков BLASTN, MegaBLAST, discontiguous MegaBLAST . Нашелся только один ген, координаты выравнивания которого -11463-11538.
bln.txt
Был найден полный геном Bacillus subtilis AL009126 (Bacillus subtilis (strain 168) chromosome, complete sequence). В этом файле имеется 3 гена, координаты выравниваний этих генов, соответственно (31935-32006, 11462-11538, 3171273-3171202).
megb.txt
Ничего не найдено.
dicmegb.txt
Найден полный геном. Как и в файле найдено 4 выравнивания, три из которых совпадают с теми, которые сделала программа BLASTN.
Число находок с E-value < 0,01 1 ген 3 гена 3 гена
Характеристика лучшей находки:
      E-value 1e-22
  1. 2e-23
  2. 2e-23
  3. 1e-18
  1. 2e-23
  2. 2e-23
  3. 1e-18
      длина выравнивания Полезное выравнивание составляет 75 нуклеотидов. 71 во всех трёх случаях. 71 во всех трёх случаях.
      вес выравнивания 93,6
  1. 103
  2. 103
  3. 87,7
  1. 103
  2. 103
  3. 87,7
      координаты в геноме 11463-11538
  1. 31935-32006
  2. 11467-11538
  3. 3171273-3171202 (complement)
  1. 31935-32006
  2. 11467-11538
  3. 3171273-3171202 (complement)
Аннотация лучшей находки по записи EMBL:
      имя гена trnO-Ile trnA-Ile, trnO-Ile, trnB-Ile2 . trnA-Ile, trnO-Ile, trnB-Ile2 .
      это tRNA? Да Да Да
      это тоже изолейциновая tRNA? Да Да Да


Команды, использованные при выполнении задания. - formatdb -i bs_genome.fasta -n bs -p F Было получено 3 индексных файла : bs.nhr, bs.nsq, bs.nin. - blastall -p blastn -d bs -i iliV.fasta -o bln.txt Был получен файл с выравниванием нуклеотидных последовательностей, с помощью программы BLASTN - megablast -d bs -i ileV.fasta -D 2 -o megb.txt Замечание: при использовании опции - D и при не использовании этой опции результат был одинаков - файл был пуст. Но если использовать эту опцию с параметром 2, мы получим файл в формате использующимся в on-line версии BLAST, а если использовать эту опцию без параметра, то мы получим файл в знакомом формате. - megablast -d bs -i ileV.fasta -D 2 -N 1 -W 11 -t 21 -o dicmegb.txt Размер слова (-W) равен 11 (число нуклеотидов, которые программа воспринимает как значимые). Тип паттерна (-N) - некодирующий (-2), длина паттерна 21 символ (чем больше длина паттерна, тем меньше число случайных находок). - fasta34 ileV.fasta bs_genome.fasta 6 При выполнении этой команды, программа спросила несколько вопросов: сколько находок показать, показать ли еще, отображать ли выравнивания и сколько. В итоге, был получен файл с 4 находками и с одним значимым выравниванием.

Подведем итог.

Хуже всех справилась с поставленной задачей программа MEGABLAST. Эта программа больше всего подходит для поиска копий гена, а не для гомологов. Но MEGABLAST есть свои преимущества, например можно варьировать специфичность поиска, изменяя длину паттерна и его тип. Что же касается программы FASTA34, то она нашла один ген. Видимо, алгоритм этой программы предназначен не для таких больших последовательностей. Все остальные программы более или менее справились с поставленной задачей.


©Трембицкая Влада