Работа с программой getorf пакета EMBOSS
При работе с getorf использовала командуgetorf -minsize 30 -find 1 -table 0
Пятая из найденных открытых рамок соответствует последовательности из поля FT.
Последняя, девятая, открытая рамка соответствует записи Swiss-Prot, на которую ссылается данная последовательность.
Последовательность
Она значительно длиннее как справа, так и слева, возможно потому, что белок из Swiss-Prot принадлежит E. Coli, а ген - Rattus norvegicus. Эта бактериЯ, применяется для синтеза белка данного гена, сделовательно, в ходе модификаций белок соединяется в начале и конце с другими участками.
Поиск гомологов некодирующих последовательностей программой BLASTN
Я запустила 3 варианта BLAST:С параметром по умолчанию blastn -task blastn -query trna_bacsu.fasta -db sa -evalue 0.01 -out trna_sa -outfmt 6
C измененной весовой матрицей blastn -task blastn -query trna_bacsu.fasta -db sa -evalue 0.01 -out trna_matrix -outfmt 6 -reward 5 -penalty -4 -gapopen 10 -gapextend 6
При минимальном значении word sizeblastn -task blastn -query trna_bacsu.fasta -db ыф -evalue 0.01 -out trna_word -outfmt 6 -reward 5 -penalty -4 -gapopen 10 -gapextend 6 -word_size 4
Результат работы в файле EXсel
Анализ результатов
При изменении параметров поиска число найденных гомологов постепенно увеличиваетсяПара, которая не находится при стандартных параметрах BLAST, но находится при изменении параметра word size (он в меньшей степени ограничивает поиск)
BSn5_t20894 embl|AL766854|AL766854 70.59 68 20 0 2 69 20362 20429 1e-05 41.57
Выравнивание needle
Выравнивания тРНК и гомологичного ей участка из генома Streptococcus agalactiae:
Length: 97
Identity: 36/97 (37.1%)
Similarity: 36/97 (37.1%)
Gaps: 55/97 (56.7%)
Score: 79.5
Данные участки не очень похожи друг на друга и могли найтись только при слабом ограничении поиска.
B поле FT записи EMBL, описывающей геном бактерии, сказано, что найденный участок кодирует tRNA-Cys, когда ген из B.subtilis кодирует tRNA-Gln