Учебный сайт Валяевой Анны
Standalone BLAST
Поиск некодирующих РНК (misc_RNA), аннотированных в одном штамме, в геноме другого штамма
Вначале с FTP-сервера NCBI был получен файл со всеми аннотированными РНК бактерии штамма Bacillus_subtilis_168_uid57675 (NC_000964). Далее, чтобы создать список только некодирующих РНК (misc_rna), были выполнены следующие команды:
infoseq NC_000964.frn -only -usa -description > infoseq.txt egrep "_misc_RNA_" infoseq.txt > misc_rna.list seqret @misc_rna.list misc_rna_NC_000964.frn
В результате был получен список последовательностей некодирующих РНК (misc RNA) в файле misc_rna_NC_000964.frn.
Затем аналогично были получены файлы с геномом штамма Bacillus_subtilis_spizizenii_TU_B_10_uid73967: в формате GenBank и в формате fasta.
С помощью программы megablast были найдены гомологи некодирующих РНК бактерии штамма Bacillus_subtilis_168_uid57675 в геноме штамма Bacillus_subtilis_spizizenii_TU_B_10_uid73967. Выданный программой файл: blastn_misc6.out. Результат представлен в таблице. Для работы с локальным blastn были использованы следующие команды:
makeblastdb -in NC_016047.fna -dbtype nucl blastn -task megablast -query misc_rna_NC_000964.frn -db NC_016047.fna -out blastn_misc.out
-outfmt 6 -num_alignments 1
Поиск гомологов РНК Bacillus subtilis в геноме другой бактерии
Для этого задания я выбрала геном бактерии штамма Bacillus_cereus_E33L_uid58103. Был произведен поиск гомологов misc_RNA из генома Bacillus_subtilis_168_uid57675 в геноме Bacillus_cereus_E33L_uid58103 тремя программами: megablast, blastn с параметрами по умолчанию и blastn с параметрами: длина слова = 4, награда за совпадение = 1, штраф за несовпадение = –1. Результаты представлены в таблице, где для каждой misc_RNA указано количество гомологов c e-value < 0.001. Использованные команды:
makeblastdb -in NC_006274.fna -dbtype nucl blastn -task megablast -query misc_rna_NC_000964.frn -db NC_006274.fna -evalue 0.001 -outfmt 6
-out megablast_e6.out blastn -task blastn -query misc_rna_NC_000964.frn -db NC_006274.fna -evalue 0.001 -outfmt 6
-out blastn_e6.out blastn -task blastn -query misc_rna_NC_000964.frn -db NC_006274.fna -penalty -1 -reward 1
-word_size 4 -evalue 0.001 -outfmt 6 -out blastn_par_e6.out
Поиск неправильно аннотированных генов программой blastx
Для этого задания нужно было скачать последовательности предсказанных белков штамма Bacillus_subtilis_spizizenii_TU_B_10_uid73967: NC_016047.faa, и провести поиск гомологов misc_RNA из предыдущих заданий в скачанных белковых последовательностях с помощью программы blastx. Использованные команды:
makeblastdb -in NC_016047.faa -dbtype prot blastx -query misc_rna_NC_000964.frn -db NC_016047.faa -evalue 0.001 -outfmt 6
-out blastx_e6.out
В итоге (blastx_e6.out) нашелся один "гомолог" для misc RNA 20611-20823 - серил-тРНК синтетеаза (seryl-tRNA synthetase).
Дата последнего обновления: 06.12.14
©Валяева Анна