Entrez Direct, BLAST+, EMBOSS


Задание 1
Поиск гомологов белков в неаннотированном геноме

Цель задания: с помощью BLAST+ сделать вывод о наличии гомолога белка в неаннотированной сборке генома Amoeboaphelidium protococcarum (примитивный родственник грибов). Для начала нужно было выбрать близкий к исследуемому организм. Чтобы это сделать, я начала проводить поиск в UniProtKB по таксонам и аннотированным белкам (каждый раз поднималась по таксонам выше). В итоге я решила искать белки принадлежащие Fungi, так как результаты мне порнавились (запрос в UniProtKB: taxonomy:fungi AND reviewed:yes). Исходя из этого поиска, можно сделать вывод, что организм с наибольшим количеством аннотированных белков (7,985) - это Saccharomyces cerevisiae. В конечном итоге я искала белки именно по нему (запрос в UniProtKB: taxonomy: taxonomy:saccharomyces cerevisiae AND reviewed:yes). Далее я скачала сборку генома Amoeboaphelidium protococcarum и с помощью команды makeblastdb создала базу данных ( makeblastdb -in X5.fasta -dbtype nucl).

Задание 2
Упражнения по EMBOSS

Задание находится здесь: ~/term3/pr9/emboss.txt.

Задание 3
Работа с Entrez Direct

Задание находится здесь: ~/term3/pr9/edirect.sh.