Семестры Домой Проекты Обо мне

Standalone BLAST

Упр.1.Поиск в геноме участков, кодирующих белки, похожие на заданный


Чтобы определить, закодированы ли в геноме бактерии возбудителя листериоза - Listeria monocytogenes белки похожие на белок MOXC_BACSU (1YW1 или O34974).
Для этого был проведен поиск по всему геному бактери с помощью программы tblastn.

Поиск гомологов белка MOXC_BACSU в геноме бактерии Listeria monocytogenes

Находки с E-value < 0,001 1
E-value лучшей находки 2e-146
Название последовательности с лучшей находкой HPB2262
Координаты лучшей находки 23954 - 25159
Доля последовательности белка, вошедшая в выравнивание с лучшей находкой 0.69

Упр.2.Поиск гомологов некодирующих последовательностей программой BLASTN

С помощью полученной ранее БД определялось количство гомологов из тРНК генома Bacillus subtilis содержится в геноме Listeria monocytogenes. Использованная команда:

blastn -task blastn -query trna_bacsu.fasta -db sa_genome.fasta -out blast0.out -evalue 0.01 -outfmt 7

Выполненное задание находится здесь

Упр.3.Поиск гомологов при измененных параметрах программы BLASTN


Повоторяли предыдущее задание с другими параметрами: измененной весовой матрицей (-reward 5, -penalty -4, -gapopen 25 и -gapextend 10), длиной слова (по умолчанию, максимальной и минимальной).

Использовались команды:

time blastn -task blastn -query trna_bacsu.fasta -db sa_genome.fasta -out blast1.out -evalue 0.01 -outfmt 7
 -reward 5 -penalty -4 -gapopen 25 -gapextend 10

time blastn -task blastn -query trna_bacsu.fasta -db sa_genome.fasta -out blast2.out -evalue 0.01 -outfmt 7
 -reward 5 -penalty -4 -gapopen 25 -gapextend 10 -word_size 4

time blastn -task blastn -query trna_bacsu.fasta -db sa_genome.fasta -out blast3.out -evalue 0.01 -outfmt 7
 -reward 5 -penalty -4 -gapopen 25 -gapextend 10 -word_size 2147483647

Результат - таблица с названиями тРНК и числом находок каждой выдачи blast в файле trna.xls

Файлы blast: blast1.out, blast2.out, blast3.out.

Упр.4.Анализ результатов


Когда вес был изменен, количество находок сократилсь

В файле blast2.out с выдачей blastn при минимальном word_size была выбрана пара BSn5_t20966 - AL766845, которой нет в других файлах. С помощью команды seqret был вырезан гомологичный участок из AL766845, и последовательности были выравнены с помощью программой needle. Характеристики самого лучшего выравнивания :

# Identity:      33/91 (36.3%)
# Similarity:    33/91 (36.3%)
# Gaps:          49/91 (53.8%)
# Score: 29.5
#
#
#=======================================

BSn5_t20966        1 gggcctgta-gctca--gctgg-----ttagagcgcacgcctga----ta     38
                           .|| || ||  |||||     |||..||.|      ||    ||
AL766845           1 ------ttatgc-cattgctggacctattattgctc------gaaaatta     37

BSn5_t20966       39 agcgtgaggt--cggtggttcgagtccactcaggcccacca     77
                     |     |.||  |..||.|||  .||
AL766845          38 a-----atgttcctttgcttc--atc---------------     56


Контакты
Ленинские горы МГУ 1, стр. 73
8-916-939-49-78
jiabicht@rambler.ru
vk.com/allweiss
FBBФакультет Биоинженерии и Биоинформатики