Entrez Direct, BLAST+, EMBOSS

Поиск гомологов белков в неаннотированном геноме

Для выполнения данного задания нам было необходимо выбрать организмы, которые по таксономии наиболее близкие к исходному организму и при этом содержат наибольшее количество аннотированных последовательностей.Внимательшим образом, изучив таксономию, мы пришли к выводу, что его ближайшим родственноком являются Saccharomyces cerevisiae. Далее в UniProtKB при поиске taxonomy:saccharomyces cerevisiae AND reviewed:yes нами были выбраны следующие белки:

Для нахождения гомологичной последовательности нами, при помощи команды makeblastdb -in X5.fasta -dbtype nucl были созданы файлы (X5.fasta.nhr, X5.fasta.nin, X5.fasta.nsq), благодаря которым и происходит поиск гомологов. Далее, при помощи команды tblastn -query *.fasta -db X5.fasta -out *_result.txt(где * название файла)

Таким образом, мы получили следующие результаты:

Низкий E-value и достаточно не плохой процент идентичности свидетельствует о гомологичности данных последовательностей. Все результаты находятся в o.wqmlx/term3/pr9.

Упражнения по EMBOSS

Файл с командами находится по пути o.wqmlx/term3/pr9/emboss.txt.

Работа с Entrez Direct

Скрипт находится по пути o.wqmlx/term3/pr9/edirect.sh