Выполнена команда:
getorf -sequence d89965.fasta -minsize 30 -table 0 -find 1 -outseq d89965.orf
Программа getorf осуществляет поиск открытых рамок считывания последовательности
-sequence d89965.fasta файл с последовательностью на входПользуясь поиском BLASTP кодирующей последовательности, приведенной в поле FT записи d89965, в выдаче getorf, получил:
-minsize 30 минимальная длина рамки (по умолчанию 30)
-table 0 таблица генетических кодов (можно не писать, по уполчанию 0)
-find 1 открытая раамка считывания включает стоп-кодон
-outseq d89965.orf файл с результатом
Subject= D89965.1_5 [163 - 432] Rattus norvegicus mRNA for RSS, complete cds. Length=90 Score = 190 bits (482), Expect = 1e-54, Method: Compositional matrix adjust. Identities = 90/90 (100%), Positives = 90/90 (100%), Gaps = 0/90 (0%) Query 1 MALMHFQFTFKQFEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHM 60 MALMHFQFTFKQFEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHM Sbjct 1 MALMHFQFTFKQFEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHM 60 Query 61 AVTAYAYYSCHELTPWLRIQSTNPVQKYGA 90 AVTAYAYYSCHELTPWLRIQSTNPVQKYGA Sbjct 61 AVTAYAYYSCHELTPWLRIQSTNPVQKYGA 90Таким образом, рамка D89965.1_5 соответствует кодирующей последовательности.
Query= sp|P0A7B8|HSLV_ECOLI ATP-dependent protease subunit HslV OS=Escherichia coli (strain K12) GN=hslV PE=1 SV=2 Length=176 Subject= D89965.1_9 [294 - 1] (REVERSE SENSE) Rattus norvegicus mRNA for RSS, complete cds. Length=98 Score = 200 bits (509), Expect = 2e-57, Method: Compositional matrix adjust. Identities = 98/98 (100%), Positives = 98/98 (100%), Gaps = 0/98 (0%) Query 28 MKGNVKKVRRLYNDKVIAGFAGGTADAFTLFELFERKLEMHQGHLVKAAVELAKDWRTDR 87 MKGNVKKVRRLYNDKVIAGFAGGTADAFTLFELFERKLEMHQGHLVKAAVELAKDWRTDR Sbjct 1 MKGNVKKVRRLYNDKVIAGFAGGTADAFTLFELFERKLEMHQGHLVKAAVELAKDWRTDR 60 Query 88 MLRKLEALLAVADETASLIITGNGDVVQPENDLIAIGS 125 MLRKLEALLAVADETASLIITGNGDVVQPENDLIAIGS Sbjct 61 MLRKLEALLAVADETASLIITGNGDVVQPENDLIAIGS 98Такое несоответствие можно объяснить тем, что кодирующая последовательность в записи EMBL была определена неправильно: вместо крысы, возможно, была отсеквенирована кишечная палочка, которая жила в её пищеварительном тракте. На SwissProt мы полагаемся, так как это курируемая база данных.
blastn -query trna_bacsu.fasta -db hh -out trna2.fasta -evalue 0.01 -task blastn -outfmt 7 -reward 5 -penalty -4 -gapopen 10 -gapextend 62)
blastn -query trna_bacsu.fasta -db hh -out trna3.fasta -evalue 0.01 -task blastn -outfmt 7 -reward 5 -penalty -4 -gapopen 10 -gapextend 6 -word_size 43)
blastn -query trna_bacsu.fasta -db hh -out trna4.fasta -evalue 0.01 -task blastn -outfmt 7 -word_size 4
#======================================= # # Aligned_sequences: 2 # 1: CP002213 # 2: BSn5_t20966 # Matrix: EDNAFULL # Gap_penalty: 10.0 # Extend_penalty: 0.5 # # Length: 81 # Identity: 50/81 (61.7%) # Similarity: 50/81 (61.7%) # Gaps: 9/81 (11.1%) # Score: 139.0 # # #======================================= CP002213 1 -gggatgtagctcagcttggtagag----cacctggtttgggaccagggg 45 ||..||||||||||||.|.||||| |.||||.| .|.|..|.| BSn5_t20966 1 gggcctgtagctcagctggttagagcgcacgcctgat----aagcgtgag 46 CP002213 46 gtcgcatgttcaaatcgtgtcatcccgacca 76 ||||...||||.|.||...|||..||.|||| BSn5_t20966 47 gtcggtggttcgagtccactcaggcccacca 77Выравнивание показывает, что последовательности гомологичны. Высокая идентичность наблюдается в нескольких участках, что, предположительно, связано с достаточно консервативной пространственной структурой тРНК, вариабельные участки - (1) видовые особенности разных бактерий. Стоит отметить, что у Bacillus тРНК изолейциновая, а у Paenibacillus polymyxa пролиновая, как показывает аннотация ниже, - это (2) причина различий..