Параметры formatdb:"-i"- полное имя файла подаваемого на вход, "-p"- тип последовательности в файле(T-аминокислотная, F- нуклеотидная), "-n"- базовое имя для файлов BLAST
Используя команду:
formatdb -i vc_genome.fasta -p F -n vc
Были получены индексные файлы:vc.nhr,vc.nin,vc.nsq
Также были введены команды:"formatdb -i pm_genome.fasta -p F -n pm", "formatdb -i pa_genome.fasta -p F -n pa". И были получены ещё 6 индексных файлов.
Чтобы получить выравнивания, были использованы команды:
blsatall -p tblastn -d vc -i dcd_ecoli -o result.txt - для Vibrio cholerae blsatall -p tblastn -d pa -i dcd_ecoli -o result1.txt - для Pseudomonas aeruginosa blsatall -p tblastn -d pm -i dcd_ecoli -o result2.txt - для Pasteurella multocida blsatall -p tblastn -d 3g -i dcd_ecoli -o result3.txt - для трёх геномов
Поиск гомологов DCD_Ecoli | Геном Vibrio cholerae | *Геном Pseudomonas aeruginosa | *Геном Pasteurella multocida | |
Характеристика лучшей находки: | ||||
E-value находки | 3.7 | 3e-09 | 3e-81 | |
координаты выравнивания(-ий) в записи генома |
1627-1728 | 264-674 | 10265-10843 | |
AC соответствующей записи EMBL | AE004411 | AE004769 | AE006134 | |
Координаты CDS в записи EMBL (если они есть) | 110..2059 | complement(10259..10843) | ||
AC UniProt в записи EMBL (если есть) | Q9KLB7 | нет данных | P57891 | |
Число находок с Е-value<0,01 |
0 | 1 | 1 | |
Число находок с Е-value<0,01 при поиске по трём геномам | 0 | 1 | 1 | |
Изменение E-value лучшей находки | нету | 6e-09 | 2e-80 |
Чтобы получить выравнивания, была выполнена команда:blastall -p blastn -d 3g -i dcdgen.fasta -o result24.txt. В итоге лучшая находка выглядит так:
>embl|AE004680|AE004680 Pseudomonas aeruginosa PAO1, section 241 of 529 of the complete genome. Length = 12370 Score = 42.1 bits (21), Expect = 0.001 Identities = 24/25 (96%) Strand = Plus / Minus Query: 259 gagctggcgctggcggtgacgctgg 283 |||||||||||||||||| |||||| Sbjct: 6942 gagctggcgctggcggtggcgctgg 6918
Как видно E-value лучшей находки равно 0.001. Лучшей находкой стала нуклеотидная последовательность Pseudomonas aeruginosa PAO1, section 241 of 529 of the complete genome.