Учебный сайт Валяевой Анны

Standalone BLAST

Поиск некодирующих РНК (misc_RNA), аннотированных в одном штамме, в геноме другого штамма

Вначале с FTP-сервера NCBI был получен файл со всеми аннотированными РНК бактерии штамма Bacillus_subtilis_168_uid57675 (NC_000964). Далее, чтобы создать список только некодирующих РНК (misc_rna), были выполнены следующие команды:

infoseq NC_000964.frn -only -usa -description > infoseq.txt
egrep "_misc_RNA_" infoseq.txt > misc_rna.list
seqret @misc_rna.list misc_rna_NC_000964.frn
	  

В результате был получен список последовательностей некодирующих РНК (misc RNA) в файле misc_rna_NC_000964.frn.

Затем аналогично были получены файлы с геномом штамма Bacillus_subtilis_spizizenii_TU_B_10_uid73967: в формате GenBank и в формате fasta.

С помощью программы megablast были найдены гомологи некодирующих РНК бактерии штамма Bacillus_subtilis_168_uid57675 в геноме штамма Bacillus_subtilis_spizizenii_TU_B_10_uid73967. Выданный программой файл: blastn_misc6.out. Результат представлен в таблице. Для работы с локальным blastn были использованы следующие команды:

makeblastdb -in NC_016047.fna -dbtype nucl
blastn -task megablast -query misc_rna_NC_000964.frn -db NC_016047.fna -out blastn_misc.out
-outfmt 6 -num_alignments 1

Поиск гомологов РНК Bacillus subtilis в геноме другой бактерии

Для этого задания я выбрала геном бактерии штамма Bacillus_cereus_E33L_uid58103. Был произведен поиск гомологов misc_RNA из генома Bacillus_subtilis_168_uid57675 в геноме Bacillus_cereus_E33L_uid58103 тремя программами: megablast, blastn с параметрами по умолчанию и blastn с параметрами: длина слова = 4, награда за совпадение = 1, штраф за несовпадение = –1. Результаты представлены в таблице, где для каждой misc_RNA указано количество гомологов c e-value < 0.001. Использованные команды:

makeblastdb -in NC_006274.fna -dbtype nucl
blastn -task megablast -query misc_rna_NC_000964.frn -db NC_006274.fna -evalue 0.001 -outfmt 6 
-out megablast_e6.out blastn -task blastn -query misc_rna_NC_000964.frn -db NC_006274.fna -evalue 0.001 -outfmt 6
-out blastn_e6.out blastn -task blastn -query misc_rna_NC_000964.frn -db NC_006274.fna -penalty -1 -reward 1
-word_size 4 -evalue 0.001 -outfmt 6 -out blastn_par_e6.out

Поиск неправильно аннотированных генов программой blastx

Для этого задания нужно было скачать последовательности предсказанных белков штамма Bacillus_subtilis_spizizenii_TU_B_10_uid73967: NC_016047.faa, и провести поиск гомологов misc_RNA из предыдущих заданий в скачанных белковых последовательностях с помощью программы blastx. Использованные команды:

makeblastdb -in NC_016047.faa -dbtype prot
blastx -query misc_rna_NC_000964.frn -db NC_016047.faa -evalue 0.001 -outfmt 6 
-out blastx_e6.out

В итоге (blastx_e6.out) нашелся один "гомолог" для misc RNA 20611-20823 - серил-тРНК синтетеаза (seryl-tRNA synthetase).

Дата последнего обновления: 06.12.14
©Валяева Анна