Главная |
Поиск некодирующих РНК (misc_RNA), аннотированных в одном штамме, в геноме другого штамма С FRP-сервера NCBI был скачен файл NC_000964.frn, содержащий последовательности всех РНК организма Bacillus_subtilis_168_uid57675 в формате fasta. С помощью команды: infoseq NC_000964.frn | grep 'misc_RNA' | awk '{ print $1 }' > usa.txt(последняя команда позволяет получить только первый столбец таблицы, полученной с помощью команды infoseq) был получен список универсальных адресов (USA) всех некодирующих РНК (miscRNA). Далее этот список был подан на вход программе seqret для получения последовательностей miscRNA: seqret @USA.txt misc.fasta Также с FTP-сервера NCBI были скачены файлы NC_016047.fna и NC_016047.gbk организма Bacillus_subtilis_spizizenii_TU_B_10_uid73967. С помощью команды: makeblastdb -in NC_016047.fna -dbtype nuclбыла создана нуклеотидная база данных в виде трёх файлов: NC_016047.fna.nhr, NC_016047.fna.nin и NC_016047.fna.nsq. С помощью команды: blastn -task megablast -query misс.fasta -db NC_016047.fna -out blast.out -outfmt 7 -num_alignments 1был получен файл blast.out, содержащий информацию о выравниваниях. На основе этой информации была получена таблица excel, содержащая информацию о miscRNA Bacillus_subtilis_168_uid57675. С помощью скрипта python был получен файл без комментариев. Информация о том, прямая или обратная это цепь была взята из файла NC_000964.gbk. В таблицу была внесена информация о лучшем гомологе (в случае наличия нескольких). Поиск гомологов РНК Bacillus subtilis в геноме другой бактерии Был скачен файл NC_012472.fna с геномом бактерии Bacillus_cereus_03BB102_uid59299 в формате fasta. На основе файла была создана нуклеотидная база данных. Был произведён поиск гомологов miscRNA из первого задания тремя способами. megablast: blastn -task megablast -query misc.fasta –db NC_012472.fna -out megablast.out -outfmt 7 -num_alignments 1 -word_size 4 -reward 1 -penalty -1 blastn: (параметры по умолчанию): blastn -task blastn -query misc.fasta -db NC_012472.fna -out blastn1.out -outfmt 7 -num_alignments 1 -evalue 0.001 blastn: blastn -task blastn -query misc.fasta -db NC_012472.fna -out blastn2.out -outfmt 7 -num_alignments 1 -word_size 4 -reward 1 -penalty 1 -evalue 0.001 Были получены файлы: megablst.out, blastn1.out, blastn2.out. Таблицу, в которой отражено количество находок, полученных в каждом случае, можно скачать по ссылке. |
Обо мне | |
Семестры | |
Ссылки | |