StandaloneBlast
Отредактировано 22/09/13
StandaloneBlast Поиск в геноме участков, кодирующих белки, похожие на заданный Таблица 1 Поиск гомологов белка TENI_BACSU в геноме Geobacillus thermodenitrificans
Поиск гомологов некодирующих последовательностей программой BLASTN При запуске программы blastn в качестве последовательности для поиска был указан файл trna_bacsu.fasta, а в качестве банка – геном бактерии Geobacillus thermodenitrificans, отформатированный ранее. Был установлен табличный формат выдачи и E-value = 0,01: blastn -task blastn -query trna_bacsu.fasta -db gt_genome.fasta -evalue 0.01 -outfmt 6. В результате получен файл trna.txt. Используя команду grep, получаем количество находок для данной последовательности. Для нахождения числа находок для каждой последовательности был создан скрипт, результат которого представлен в файле trna.xls Поиск гомологов при измененных параметрах программы BLASTN Программа blastn была запущенна еще два раза, но с измененными параметрами. Кроме того, слово «time» указывает на отслеживание времени выполнения работы программы. В первый раз была изменена весовая матрица: -reward 5, -penalty -4. Чтобы программа начала работу следует поменять параметры –gapopen 25 и –gapextend 10. Была выполнена команда: time blastn -task blastn -query trna_bacsu.fasta -db gt_genome.fasta -out blast1.out -evalue 0.01 -outfmt 7 -reward 5 -penalty -4 -gapopen 25 -gapextend 10 Во второй раз, оставив измененные ранее параметры, изменим значения параметра –word_size на минимально возможное (–word_size 4). Была выполнена команда: time blastn -task blastn -query trna_bacsu.fasta -db gt_genome.fasta -out blast1.out -evalue 0.01 -outfmt 7 -reward 5 -penalty -4 -gapopen 25 -gapextend 10 –word_size 4 В результате был получен файл trna2.xls Анализируя полученные результаты, можно сказать, что при изменении весовой матрицы произошло увеличение числа находок. При минимальной длине слова находок больше. Была выбрана пара: tRNA B. subtilis и гомологичный участок из бактерии Geobacillus thermodenitrificans (). С помощью команды seqret -sask вырезали гомологичный участок в файл. Программой needle было сделано выравнивание полученного участка с исходной последовательностью. Ниже приведены характеристики выравнивания. # Identity: 36/97 (37.1%) # Similarity: 36/97 (37.1%) # Gaps: 54/97 (55.7%) # Score: 87.5 # # #======================================= BSn5_t21014 1 gcgcccgtagctcaattggatagagcgttcgactacggatcaaaaggtta 50 |||| |||||| ||| |.|||| | CP000557 1 gcgc----------------tagagc---cga-tccgga----------a 20 BSn5_t21014 51 ggggttcgactcctctcgggcgcgcca-------------------- 77 .|.|||||.|| |.|.|||||.|| CP000557 21 agcgttcggct----tagagcgcgtcattgtctcgacgtaccaagct 63 Выравнивание достаточно слабое. Взятый участок аннотирован и является аргининовой тРНК. Участок, взятый из B. subtilis, тоже является аргининовой тРНК. Время работы программы BLAST Программа быстрее всего работает при стандартных параметрах. При измененных параметрах время отклика программы является самым большим. Возможно, это связано с тем, что при измененных параметрах оказывается находок больше. |
|||||||||||
© Малеева Александра
|