getorf -sequence d89965.entret -outseq qw.orf -minsize 30 -find 1 -table 0
Вот результат getorf:
>D89965_5 [163 - 432] Rattus norvegicus mRNA for RSS, complete cds. MALMHFQFTFKQFEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHM AVTAYAYYSCHELTPWLRIQSTNPVQKYGA
FT CDS 163..435 ... FT /translation="MALMHFQFTFKQFEQRKSIRSTARKARDDFVVVQTADLFHVAFHY FT GIAQRGLTITSDDHMAVTAYAYYSCHELTPWLRIQSTNPVQKYGA"
>D89965_9 [294 - 1] (REVERSE SENSE) Rattus norvegicus mRNA for RSS, complete cds. MKGNVKKVRRLYNDKVIAGFAGGTADAFTLFELFERKLEMHQGHLVKAAVELAKDWRTDR MLRKLEALLAVADETASLIITGNGDVVQPENDLIAIGS
blastn -query trna_bacsu.fasta -db sa -out 3res1 -evalue 0.01 -task blastn -outfmt 7 -reward 5 -penalty -4 -gapopen 10 -gapextend 6Для второго: минимальный размер слова это 4; вот команда:
blastn -query trna_bacsu.fasta -db sa -out 3res2 -evalue 0.01 -task blastn -outfmt 7 -reward 5 -penalty -4 -gapopen 10 -gapextend 6 -word_size 4*Дополнительное задание:
blastn -query trna_bacsu.fasta -db sa -out add -evalue 0.01 -task blastn -outfmt 7 -word_size 4
embl|AL766854|AL766854Причина этого кроется в эффективности поиска гомологов объединением "усилий" с обоих сторон.
# Length: 73 # Identity: 50/73 (68.5%) # Similarity: 50/73 (68.5%) # Gaps: 7/73 ( 9.6%) # Score: 165.0Вот само выравнивание:
AL766854 1 -gcggtatagccaagtggtaaggca--cggctctgcaaaagcttgatcgt 47 |.|.||||||||||.||||||||| .|.||.|| |...|.||||||| BSn5_t20894 1 tgggctatagccaagcggtaaggcaatggactttg--actccgtgatcgt 48 AL766854 48 cggttcaaatccgtctaccgc-- 68 .|||||.|||||..|||.|.| BSn5_t20894 49 tggttcgaatccagctagcccag 71Как видно, последовательности достаточно идентичны и рознятся с некой периодичностью.