Командная строка: getorf -minsize 30 -find 1 -table 0
5-ая рамка,соответствует приведённой в поле FT кодирующей последовательности (CDS):
>D89965_5 [163 - 432] Rattus norvegicus mRNA for RSS, complete cds.
MALMHFQFTFKQFEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHMAVTAYAYYSCHELTPWLRIQSTNPVQKYGA
9-ая открытая рамка считывания соответствует последовательности белка HSLV_ECOLI:
>D89965_9 [294 - 1] (REVERSE SENSE) Rattus norvegicus mRNA for RSS, complete cds.
MKGNVKKVRRLYNDKVIAGFAGGTADAFTLFELFERKLEMHQGHLVKAAVELAKDWRTDRMLRKLEALLAVADETASLIITGNGDVVQPENDLIAIGS.
Заметим, что последовательность из Swiss-Prot гораздо длиннее рамки, причём обеих сторон. Такое несоответствие можно объяснить тем, что кодирующая последовательность в записи EMBL была определена неправильно: вместо крысы была отсеквенирована кишечная палочка, которая жила в её пищеварительном тракте.
Результаты работы представлены в виде таблицы trna.xls
Командная строка для blastn:
blastn -task blastn -query trna_bacsu.fasta -db sa -evalue 0.01 -out trna_sa -outfmt 6
Командная строка для замены весовой матрицы:
blastn -task blastn -query trna_bacsu.fasta -db sa -evalue 0.01 -out trna2 -outfmt 6 -reward 5 -penalty -4 -gapopen 10 -gapextend 6
Командная строка при минимальном значении word size:
blastn -task blastn -query trna_bacsu.fasta -db sa -evalue 0.01 -out trna3 -outfmt 6 -reward 5 -penalty -4 -gapopen 10 -gapextend 6 -word_size 4
Число найденных гомологов при изменении параметров расчёта веса выравнивания и изменении длины слова увеличивается.
Пара не находится программой BLAST при стандартных параметрах и изменении весовой матрицы,но находится при замене параметра -word_size (так как он менее ограничивающий из указанных):
BSn5_t20894 embl|AL766854|AL766854 70.59 68 20 0 2 69 20362 20429 1e-05 41.57
Выравнивание needle
BSn5_t20894 1 ---------------------tg---ggctatagccaagcggtaaggcaa 26 || |||||| ||| |||.|.||| AL766854 1 gcaactgcccttgagtttgcttggaaggctat---caa---gtatgtcaa 44 BSn5_t20894 27 tggactttgact-ccgtgatcgttggtt-cgaatccagctagcccag 71 |.|| .||.|||| |||||| |.|| AL766854 45 --------gtctaacgggatc-ttggttgccaa-------------- 68
Характеристики выравнивания:
Length: 97 Identity: 36/97 (37.1%) Similarity: 36/97 (37.1%) Gaps: 55/97 (56.7%) Score: 79.5
Судя по выравниванию, у которого процент идентичности и сходства не высоки, зато процент гэпов высок, данные участки последовательности не гомологичны. В поле FT записи EMBL, описывающей геном бактерии, про данный гомологичный участок сказано, что он кодирует tRNA-Cys, а ен из B.subtilis кодирует tRNA-Gln