Работа с программой getorf пакета EMBOSS

При работе с getorf использовала команду
getorf -minsize 30 -find 1 -table 0
Пятая из найденных открытых рамок соответствует последовательности из поля FT.

Последняя, девятая, открытая рамка соответствует записи Swiss-Prot, на которую ссылается данная последовательность.
Последовательность
Она значительно длиннее как справа, так и слева, возможно потому, что белок из Swiss-Prot принадлежит E. Coli, а ген - Rattus norvegicus. Эта бактериЯ, применяется для синтеза белка данного гена, сделовательно, в ходе модификаций белок соединяется в начале и конце с другими участками.

Поиск гомологов некодирующих последовательностей программой BLASTN

Я запустила 3 варианта BLAST:
С параметром по умолчанию blastn -task blastn -query trna_bacsu.fasta -db sa -evalue 0.01 -out trna_sa -outfmt 6
C измененной весовой матрицей blastn -task blastn -query trna_bacsu.fasta -db sa -evalue 0.01 -out trna_matrix -outfmt 6 -reward 5 -penalty -4 -gapopen 10 -gapextend 6
При минимальном значении word sizeblastn -task blastn -query trna_bacsu.fasta -db ыф -evalue 0.01 -out trna_word -outfmt 6 -reward 5 -penalty -4 -gapopen 10 -gapextend 6 -word_size 4
Результат работы в файле EXсel

Анализ результатов

При изменении параметров поиска число найденных гомологов постепенно увеличивается
Пара, которая не находится при стандартных параметрах BLAST, но находится при изменении параметра word size (он в меньшей степени ограничивает поиск)

BSn5_t20894	embl|AL766854|AL766854	70.59	68	20	0	2	69	20362	20429	1e-05	41.57

Выравнивание needle
Выравнивания тРНК и гомологичного ей участка из генома Streptococcus agalactiae:
Length: 97
Identity: 36/97 (37.1%)
Similarity: 36/97 (37.1%)
Gaps: 55/97 (56.7%)
Score: 79.5

Данные участки не очень похожи друг на друга и могли найтись только при слабом ограничении поиска.
B поле FT записи EMBL, описывающей геном бактерии, сказано, что найденный участок кодирует tRNA-Cys, когда ген из B.subtilis кодирует tRNA-Gln