Учебный сайт Кузнецовой Марии

Главная

Первый семестр

Второй семестр

Третий семестр

Ссылки

Об авторе

Поиск некодирующих РНК (misc_RNA), аннотированных в одном штамме, в геноме другого штамма

Получила файл со всеми misc_RNA штамма Bacillus_subtilis_168_uid57675. Для этого зашла на FTP-сервер NCBI и скачала нужный файл с расширением .frn, где лежат все аннотированные РНК этого штамма.

Посмотрела, что за РНК лежат в этом файле и как они называются. Чтобы получить файл с последовательностями только misc_RNA (без тРНК и рРНК), использовала команды infoseq (чтобы получить лист-файл), grep (чтобы отобрать из лист-файла нужные строки) и seqret. Аналогично скачала два файла с геномом штамма Bacillus_subtilis_spizizenii_TU_B_10_uid73967: в формате GenBank (расширение gbk) и в формате fasta (расширение fna).

infoseq NC_000964.frn | grep 'misc_RNA' | awk '{ print $1 }' > 1.txt
seqret @1.txt misc_rna.fasta 

Программой megablast нашла гомологи нужных РНК первого штамма в геноме второго.

blastn -task megablast -query misc_rna.fasta -db NC_016047.fna -out blast.out -outfmt 7 -num_alignments 1 

На основе полученного файла была составлена таблица, в которой для каждой misc_RNA указаны её номер, цепь (прямая или обратная относительно записи RefSeq) и координаты начала и конца лучшего найденного гомолога (Таблица с данными).

Поиск гомологов РНК Bacillus subtilis в геноме другой бактерии

Скачала геном Bacillus cereus. Провела поиск программами megablast, blastn с параметрами по умолчанию и blastn с параметрами: длина слова = 4, награда за совпадение = 1, штраф за несовпадение = –1 гомологов misc_RNA из первого задания в полученном геноме. Результат — таблица в Excel, где для каждой micsRNA указано количество гомологов c e-value < 0.001, найденных в каждом из трех вариантов поиcка.

blastn -task megablast -query misc_rna.fasta -db 1.fna -out 1.out -outfmt 7 -num_alignments 1 -evalue 0.001
blastn -task blastn -query misc_rna.fasta -db 1.fna -out 2.out -outfmt 7 -num_alignments 1 -evalue 0.001
blastn -task blastn -query misc_rna.fasta -db 1.fna -out 3.out -outfmt 7 -num_alignments 1 -evalue 0.001 -word_size 4 -penalty -1 -reward 1 

Поиск неправильно аннотированных генов программой blastx

С помощью программы blastx был произведён поиск гомологов некодирующих РНК Bacillus subtilis 168 uid57675 среди предсказанных белков Bacillus subtilis spizizenii TU B 10 uid73967. Был выбран стандартный порог Е-value. Использовалась команда:

blastx -query misc_rna.fasta -db 1.faa -out blastx.out -outfmt 7 -num_alignments 1 -evalue 0.001

Получен файл с находками — вот он. Найдены для 9 misc_RNA: 1, 25, 41, 46, 53, 57, 58, 61, 62; 2 белка проаннотированы: серил-тРНК синтаза и аспартокиназа; все остальные белки - гипотетические.

Дата последнего обновления: 15.09.2014
Copyright © Кузнецова Мария, 2013.