:
Аминокислотный остаток в 4-ой позиции белк YAHK_ECOLI | K | |
Соответствующий кодон в гене yahK | 5'-AAA-3' | |
Идеальный антикодон | 5'-UUU-3' | |
Сколько можно было бы ожидать разных тРНК для остатка K (если опираться на генетический код)? |
2 | |
Сколько тРНК для остатка K аннотировано в геноме кишечной палочки? | 6 | |
Характеристика выбранной для дальнейшего изучения тРНК: | ||
название гена | lysV | |
координаты гена в записи EMBL | 2519275..2519350 |
|
антикодон | 5'-UUU-3' |
Команда, использованная для поиска всех лизиновых тРНК в геноме.
grep "anticodon.*Lys" ecoli.embl > antilys
результаты поиска в виде преформатированного текста.
FT /anticodon=(pos:779810..779812,aa:Lys) FT /anticodon=(pos:780099..780101,aa:Lys) FT /anticodon=(pos:780403..780405,aa:Lys) FT /anticodon=(pos:780625..780627,aa:Lys) FT /anticodon=(pos:780833..780835,aa:Lys) FT /anticodon=(pos:2519308..2519310,aa:Lys)
Выбрали антикодон
/anticodon=(pos:2519308..2519310,aa:Lys)
Вырезание t-RNK:
seqret -sask ecoli.embl
Выходной файл : u00096.fasta
Программа | FastA | BLASTN | MegaBLAST | Discontigous MegaBLAST |
|
Число находок с Е-value < 0,001 | 3 | 0 | 0 | - | |
Характеристика лучшей находки: | |||||
E-value находки | 6.5e-08 |
0.38 |
0.38 |
- | |
Номер сектора генома | 47 | 157 | 157 | - | |
AC соответствующей записи EMBL | AE010172 | AE010282 | AE010282 | - | |
координаты выравнивания(-ий) в записи EMBL | 475..552 | 1781 ... 1768 |
1781 ... 1768 | - | |
Аннотация лучшей находки по EMBL (не аннотирована, аннотирована как тоже <аланиновая> тРНК, как другая тРНК etc.) |
tRNA-Lys | hypothetical protein | hypothetical protein | - |
.
Используемые команды:
BLASTN:
blastall -p blastn -d pf -i trnkseqret -o blastn
MegaBLAST:
megablast -d pf -i trnkseqret -o megablast14 -W 14
В параметре -W было выбрано значение 14, так как при больших значениях данного параметра находок нет
FAST(A):
fasta35 trnkseqret pf_genome.fasta 6
discontiguous MegaBLAST не нашел ни одной последовательности ни при какой возможной комбинации параметров.
Один из вариантов запроса в discontiguous MegaBLAST:
megablast -d pf -i trnkseqret -o dmegablast12_16_2 -W 12 -t16 -N 2
Выводы:
программы BLASTN, MegaBLAST и discontiguous MegaBLAST не подошли для поиска гомологов, так в первых двух случаях не было находок с Е-value < 0,001, в третьем же случае ни при каких параметрах находок не было. Скорее всего, данные программы не совсем предназначены для поиска гомологичных последовательностей. Программы FAST(A), наоборот, справилась с задачей. Скорее всего это связано с алгоритмом Смита- Ватермана, который подразумевает наличие матрицы замен (даже для 4 нуклеотидных оснований можно составить матрицу весов замен, по которой и будет считаться Score) и который содержиться только в программе FAST(A). Также на результат сказалась и длина слова: чем меньше слово, тем больше находок с Е-value < 0,001 - BLASTN :11, MegaBLAST:14, FAST(A):6