• Главная
  • Обо мне
  • Семестры
    Семестр 1
    Семестр 2
    Семестр 3
    Семестр 4
    Семестр 5
    Семестр 6
  • Проекты
  • Заметки
  • Ссылки
StandaloneBlast Отредактировано 22/09/13
Семестр 1
Семестр 2
Семестр 3
Семестр 4
Семестр 5
Семестр 6

StandaloneBlast



Поиск в геноме участков, кодирующих белки, похожие на заданный

Таблица 1


Поиск гомологов белка TENI_BACSU в геноме Geobacillus thermodenitrificans

Число находок с E-value < 0,001 2
E-value лучшей находки 6e-42
Название последовательности с лучшей находкой Geobacillus thermodenitrificans NG80-2, complete genome.
Координаты лучшей находки 598027- 598620
Доля последовательности белка, вошедшая в выравнивание с лучшей находкой 200/205

Поиск гомологов некодирующих последовательностей программой BLASTN

При запуске программы blastn в качестве последовательности для поиска был указан файл trna_bacsu.fasta, а в качестве банка – геном бактерии Geobacillus thermodenitrificans, отформатированный ранее. Был установлен табличный формат выдачи и E-value = 0,01: blastn -task blastn -query trna_bacsu.fasta -db gt_genome.fasta -evalue 0.01 -outfmt 6.

В результате получен файл trna.txt.

Используя команду grep, получаем количество находок для данной последовательности. Для нахождения числа находок для каждой последовательности был создан скрипт, результат которого представлен в файле trna.xls

Поиск гомологов при измененных параметрах программы BLASTN

Программа blastn была запущенна еще два раза, но с измененными параметрами. Кроме того, слово «time» указывает на отслеживание времени выполнения работы программы.

В первый раз была изменена весовая матрица: -reward 5, -penalty -4. Чтобы программа начала работу следует поменять параметры –gapopen 25 и –gapextend 10. Была выполнена команда: time blastn -task blastn -query trna_bacsu.fasta -db gt_genome.fasta -out blast1.out -evalue 0.01 -outfmt 7 -reward 5 -penalty -4 -gapopen 25 -gapextend 10

Во второй раз, оставив измененные ранее параметры, изменим значения параметра –word_size на минимально возможное (–word_size 4). Была выполнена команда: time blastn -task blastn -query trna_bacsu.fasta -db gt_genome.fasta -out blast1.out -evalue 0.01 -outfmt 7 -reward 5 -penalty -4 -gapopen 25 -gapextend 10 –word_size 4

В результате был получен файл trna2.xls

Анализируя полученные результаты, можно сказать, что при изменении весовой матрицы произошло увеличение числа находок. При минимальной длине слова находок больше.

Была выбрана пара: tRNA B. subtilis и гомологичный участок из бактерии Geobacillus thermodenitrificans (). С помощью команды seqret -sask вырезали гомологичный участок в файл. Программой needle было сделано выравнивание полученного участка с исходной последовательностью. Ниже приведены характеристики выравнивания.


# Identity:      36/97 (37.1%)
# Similarity:    36/97 (37.1%)
# Gaps:          54/97 (55.7%)
# Score: 87.5
# 
#
#=======================================

BSn5_t21014        1 gcgcccgtagctcaattggatagagcgttcgactacggatcaaaaggtta     50
                           ||||                ||||||   ||| |.||||          |
CP000557           1 gcgc----------------tagagc---cga-tccgga----------a     20

BSn5_t21014       51 ggggttcgactcctctcgggcgcgcca--------------------     77
                     .|.|||||.||    |.|.|||||.||                    
CP000557          21 agcgttcggct----tagagcgcgtcattgtctcgacgtaccaagct     63
					

Выравнивание достаточно слабое.

Взятый участок аннотирован и является аргининовой тРНК. Участок, взятый из B. subtilis, тоже является аргининовой тРНК.


Время работы программы BLAST


Программа быстрее всего работает при стандартных параметрах.

При измененных параметрах время отклика программы является самым большим. Возможно, это связано с тем, что при измененных параметрах оказывается находок больше.


© Малеева Александра