getorf -sequence d89965.entret -outseq qw.orf -minsize 30 -find 1 -table 0
Вот результат getorf:
>D89965_5 [163 - 432] Rattus norvegicus mRNA for RSS, complete cds.
MALMHFQFTFKQFEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHM
AVTAYAYYSCHELTPWLRIQSTNPVQKYGA
FT CDS 163..435
...
FT /translation="MALMHFQFTFKQFEQRKSIRSTARKARDDFVVVQTADLFHVAFHY
FT GIAQRGLTITSDDHMAVTAYAYYSCHELTPWLRIQSTNPVQKYGA"
>D89965_9 [294 - 1] (REVERSE SENSE) Rattus norvegicus mRNA for RSS, complete cds.
MKGNVKKVRRLYNDKVIAGFAGGTADAFTLFELFERKLEMHQGHLVKAAVELAKDWRTDR
MLRKLEALLAVADETASLIITGNGDVVQPENDLIAIGS
blastn -query trna_bacsu.fasta -db sa -out 3res1 -evalue 0.01 -task blastn -outfmt 7 -reward 5 -penalty -4 -gapopen 10 -gapextend 6
Для второго: минимальный размер слова это 4; вот команда:
blastn -query trna_bacsu.fasta -db sa -out 3res2 -evalue 0.01 -task blastn -outfmt 7 -reward 5 -penalty -4 -gapopen 10 -gapextend 6 -word_size 4
*Дополнительное задание:
blastn -query trna_bacsu.fasta -db sa -out add -evalue 0.01 -task blastn -outfmt 7 -word_size 4
embl|AL766854|AL766854
Причина этого кроется в эффективности поиска гомологов объединением "усилий" с обоих сторон.
# Length: 73
# Identity: 50/73 (68.5%)
# Similarity: 50/73 (68.5%)
# Gaps: 7/73 ( 9.6%)
# Score: 165.0
Вот само выравнивание:
AL766854 1 -gcggtatagccaagtggtaaggca--cggctctgcaaaagcttgatcgt 47
|.|.||||||||||.||||||||| .|.||.|| |...|.|||||||
BSn5_t20894 1 tgggctatagccaagcggtaaggcaatggactttg--actccgtgatcgt 48
AL766854 48 cggttcaaatccgtctaccgc-- 68
.|||||.|||||..|||.|.|
BSn5_t20894 49 tggttcgaatccagctagcccag 71
Как видно, последовательности достаточно идентичны и рознятся с некой периодичностью.