Были использованы следующие команды:
formatdb -i pa_genome.fasta -n ww -p F
blastall -p tblastn -d ww -i DSBA_ECOLI.fasta -o pa_tblastn.txt
Файл с результатами находится здесь.
По результатам поиска заполнила таблицу:
Поиск гомологов DSBA_Ecoli | Геном Pseudomonas aeruginosa | |
Характеристика лучшей находки: | ||
E-value находки | 5e-18 | |
координаты выравнивания(-ий) в записи генома |
9506-8982 (complement.) | |
AC соответствующей записи EMBL | AE004961 | |
Координаты CDS в записи EMBL (если они есть) | Координаты недоступны | |
AC UniProt в записи EMBL (если есть) | нет | |
Число находок с Е-value<0,01 |
1 |
С помощью выбранной ранее программы я провела поиск по трем геномам.
E-value лучшей находки | 7e-54 |
Число находок с Е-value<0,01 | 3 |
Похожие последовательности были найдены во всех трёх геномах. Лучшая находка была в геноме Pasteurella multocida. А худшая из трёх предложенных - в геноме ранее исследованной Pseudomonas aeruginosa. Но e-value изменилась. В результате поиска по трём геномам она стала 1e-17, т.е. ухудшилась.
Cоответствующее выравнивание:
127 gagtttttctctttcttctgcccgccctgt 156 ||||||||||| |||| |||||||| |||| 3349 gagtttttctcattctactgcccgcactgt 3320Aннотация соответствующего фрагмента генома:
Расположен в гене VC0034 в организме Vibrio cholerae.
product thiol:disulfide interchange protein