Использованная команда: getorf -sequence D89965.fasta -outseq D89965.orf -find 1 -minsize 30 не обязательно писать, т.к. стоит по умолчанию -table 0 таблица стандартного генетического кода, тоже стоит по умолчанию один из результатов getorf: >D89965_5 [163 - 432] Rattus norvegicus mRNA for RSS, complete cds. MALMHFQFTFKQFEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHM AVTAYAYYSCHELTPWLRIQSTNPVQKYGA совпал с последовательностью закодированного белка P0A7B8 из CDS записи D89965 в EMBL Запись в Swiss Prot совпадает с 9 рамкой getorf, начиная с 28 позиции Запись в Swiss Prot белка P0A7B8: MTTIVSVRRN GHVVIAGDGQ ATLGNTVMKG NVKKVRRLYN DKVIAGFAGG TADAFTLFEL FERKLEMHQG HLVKAAVELA KDWRTDRMLR KLEALLAVAD ETASLIITGN GDVVQPENDL IAIGSGGPYA QAAARALLEN TELSAREIAE KALDIAGDIC IYTNHFHTIE ELSYKA
Вероятно, такое несовпадение вызвано тем, что в банке EMBL лежат некурируемые последовательности, =>
есть вероятность ошибки (несовпадения с SwissProt, которому мы верим, т.к. SwissProt- курируемая БД).
В данном случае мы и наблюдаем такую ошибку. Т.к. в записи SwissProt лежит белок Escherichia coli =>
можно предположить, что вместо геном мыши был отсеквинирован геном бактерии (кишечной палочки),
живущей у нее в кишечнике.
blastn -query trna_bacsu.fasta -db pp -out E -evalue 0.01 -task blastn -outfmt 7Результаты (Первый столбец)
1) blastn -query trna_bacsu.fasta -db pp -out E2 -evalue 0.01 -task blastn -outfmt 7 -reward 5 -penalty -4 -gapopen 10 -gapextend 6 2) blastn -query trna_bacsu.fasta -db pp -out E3 -evalue 0.01 -task blastn -outfmt 7 -reward 5 -penalty -4 -gapopen 10 -gapextend 6 -word_size 4 3)* blastn -query trna_bacsu.fasta -db pp -out E4 -evalue 0.01 -task blastn -outfmt 7 -word_size 4Результаты
При увеличении penalty и reward до -4 и 5 соответственно, увеличилось число нахлдок, т.к. при значениях penalty и reward по умолчанию, значение -p по модулю выше -r => "выше цена ошибки" => при p = -4 и r = 5 больше находок, т.к. выше вес выравнивания. Поэтому рассматриваемый мною участок был найден только при p= -4 и r= 5. При увеличении длины слова до 11, мой фрагмент не был найден из-за того, что в нем нет 11 подряд выравненных нуклеотидов, т.е. невыравненные нуклеотиды расположены равномерно. Т.к. в моем примере Identity= 63% => при значении r < p в 1.5 раз,значение scre будет слабо положительным. При значении r > p в 1.25 раз, значение score будет достаточно > 0, чтобы выравнивание было отображено. Участок в геноме: gene 462589..462659 locus_tag PPSC2_ct030 tRNA 462589..462659 locus_tag PPSC2_ct030 product tRNA-Cys Выравнивается с 462590 - 462657 участком (BSn5_t20894) # Aligned_sequences: 2 # 1: BSn5_t20894 # 2: genome. # Matrix: EDNAFULL # Gap_penalty: 10.0 # Extend_penalty: 0.5 # # Length: 73 # Identity: 46/73 (63.0%) # Similarity: 46/73 (63.0%) # Gaps: 7/73 ( 9.6%) # Score: 129.0 # # #======================================= BSn5_t20894 1 tgggctatagccaagcggtaaggcaatggactttg--actccgtgatcgt 48 |.||.|||||||||.||||||||||.| ||.|| |...|.|.|||.. genome. 1 -gcgccatagccaagtggtaaggcaaag--ctctgcaaaagcttcatccc 47 BSn5_t20894 49 tggttcgaatccagctagcccag 71 ..||||.||||..|.|.||.| genome. 48 cagttcaaatctgggtggcgc-- 68 #--------------------------------------- #--------------------------------------- Две тРНК, очевидно, гомологичны, но при этом выравнивание показало, что последовательности не идентичны. Вероятно это связано с тем, что эти бактерии не являются близкородственными видами => в эволюции могли возникнуть мутации в нуклеотидах различных петель (что не редкость для тРНК). Также в тРНК встречаются парные мутации в стеблях, сохраняющие комплементарность пары. Накапливаясь эти мутации приводят к умень- шению идентичности. Вторая причина заключается в том, что две тРНК имеют разную специфичность (tRNA-Gln и tRNA-Сys) => отличаются и последовательности.