Занятие 4. Поиск гомологов некодирующей нуклеотидной последовательности

Определение тРНК, которая была (скорее всего) использована рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи белка SYY_ECOLI.


В ходе работы использовались следующие команды:
·                grep "codon.*serine" ecoli.embl>codon.txt

Получен текстовый файл codon.txt c результатами поиска в embl-файле с геномом кишечной палочки строк, в которых встречаются словa codon и serine(неподряд). Строки представляют собой поля FT embl-документа и их содержимое в записях о соответствующей сериновой тРНК.
Результаты поиска:
FT
/note="codons recognized: UCY; anticodon: GGA serine tRNA5;
FT
/note="codons recognized: UCD; anticodon: UGA serine tRNA1;
FT
/note="codons recognized: UCY; anticodon: GGA serine tRNA5;
FT
/note="codon recognized: UCG; anticodon: CGA serine tRNA2;
FT
/note="codons recognized: AGY; anticodon: GCU serine tRNA3;
 
seqret ecoli.embl –sask
 
С помощью команды seqret после ввода координат последовательности нуклеотидов для тРНК получены fasta-файл с нужной последовательностью тРНК: tRNA.fasta

Таблица 1. Выбор тРНК


Аминокислотный остаток в 4-ой позиции белка SYY_ECOLI

S

Соответствующий кодон в гене tyrS

5'-AGT -3'
Третья позиция в триплете является вырожденной, согласно таблице генетического кода на третьем месте может находится либо T либо С

Идеальный антикодон

5'-ACU-3'

Сколько можно было бы ожидать разных тРНК для остатка S
(если опираться на генетический код)?

6: TCT, TCC, TCA, TCG, AGT ,AGC

Сколько тРНК для остатка S аннотировано в геноме кишечной палочки?

Было найдено 5 генов со следующими антикодонами: GGA, UGA, GGA, CGA, GCU

Характеристика выбранной для дальнейшего изучения тРНК:


название гена

serV


координаты гена в записи EMBL

complement(2816575..2816667)


антикодон

GCU


Поиск гомологичных тРНК в геноме архебактерии

Таблица 2. Поиск в геноме < Pyrococcus furiosus> последовательностей, сходных с <сериновой> тРНК E.coli


Программа

FastA

BLASTN

MegaBLAST

Discontigous
MegaBLAST

Число находок с Е-value < 0,001

3

2

No hits found

No hits found

Характеристика лучшей находки:


E-value находки

0.00022

1e-04

-

-


Номер сектора генома

116

1

-

-


AC соответствующей записи EMBL


AE010241

AE009950

-

-


координаты выравнивания(-ий) в записи EMBL

12828-12918

4128-4109

-

-

Аннотация лучшей находки по EMBL

tRNA-Met

Ген PF0005

-

-

Использованные команды:
fasta35 tRNA.fasta pf_genome.fasta 6 (файл fastaresults.txt)
formatdb -i pf_genome.fasta -n pf -p F
blastall -p blastn -d pf -i tRNA.fasta -o blastn -e 0.001
megablast -d pf -i tRNA.fasta -o megablast -e 0.001
megablast -d pf -i tRNA.fasta -o Dmegablast -e 0.001 -W 11 -t 21 -N 2

Какой-либо положительный результат дали программы fastA и blastn. “Бластовые” программы созданы для поиска близких выравниваний, поэтому с данной задачей они не могут справитс с наилучшей эффективностью.