Поиск организма по фрагменту нуклеотидной последовательности
Первой задачей было получить файл со всеми misc_RNA штамма Bacillus_subtilis_168_uid57675. Его можно скачать здесь. После этого при помощи команды infoseq "NC_000964.frn" | grep "misc_RNA" > usa1.txt
отберем всю информацию о Misc_RNA из этого файла, затем удалим оттуда столбцы, кроме первого (файл) и при помощи команды seqret @usa1.txt miscrna.fasta получим все последовательности misc_rna в формате fasta.
Далее, были скачаны файлы NC_016047.fna и NC_016047.gbk. Затем на основе этих файлов была создана нуклеотидная база данных, содержащаяся в трех файлах: NC_016047.fna.nhr,
NC_016047.fna.nin и NC_016047.fna.nsq. Затем я запустил blastn для построения выравниваний и с помощью команды blastn -task megablast -query misс.fasta -db NC_016047.fna -out blast.out -outfmt 7 -num_alignments 1
был получен файл. с выравниваниями последовательностей misc_rna из первого штамма Bacillus subtilis с последовательностями их гомологов из второго штамма той же бактерии. На основе содержимого файла
blast.out была составлена excel таблица, содержащая информацию о misc_RNA из Bacillus subtilis.
Поиск гомологов РНК Bacillus subtilis в геноме другой бактерии