Цель задания: с помощью BLAST+ сделать вывод о наличии гомолога белка в неаннотированной сборке генома Amoeboaphelidium protococcarum (примитивный родственник грибов). Для начала нужно было выбрать близкий к исследуемому организм. Чтобы это сделать, я начала проводить поиск в UniProtKB по таксонам и аннотированным белкам (каждый раз поднималась по таксонам выше). В итоге я решила искать белки принадлежащие Fungi, так как результаты мне порнавились (запрос в UniProtKB: taxonomy:fungi AND reviewed:yes). Исходя из этого поиска, можно сделать вывод, что организм с наибольшим количеством аннотированных белков (7,985) - это Saccharomyces cerevisiae. В конечном итоге я искала белки именно по нему (запрос в UniProtKB: taxonomy: taxonomy:saccharomyces cerevisiae AND reviewed:yes). Далее я скачала сборку генома Amoeboaphelidium protococcarum и с помощью команды makeblastdb создала базу данных ( makeblastdb -in X5.fasta -dbtype nucl).
Актин
1. Получаем последовательность: seqret sw:P60010 P60010.fasta Выдача
2. Запрос в бласт: tblastn -query P60010.fasta -db X5.fasta -out P60010.txt Выдача
Было найдено много скэффолдов, три из которых имеют E-value равный 0.0 и процент идентичных аминокислот при выравнивании - 89%. Так что можно уверенно предположить, что этот белок является гомологичным.
Днк-зависимая РНК полимераза II субъединица RPB1
1. Получаем последовательность: seqret sw:P04050 P04050.fasta Выдача
2. Запрос в бласт: tblastn -query P04050.fasta -db X5.fasta -out P04050.txt Выдача
Было найдено две лучшие находки с E-value равным 0.0 и с идентичностью 52% и 53%. Возможно, что этот белок является гомологичным.
Митохондриальная бета-субъединица АТФ-синтазы
1. Получаем последовательность: seqret sw:P00830 P00830.fasta Выдача
2. Запрос в бласт: tblastn -query P00830.fasta -db X5.fasta -out P00830.txt Выдача
Было найдено много скэффолдов, один из которых имеет E-value равное 0.0 и идентичность 80%. Так что можно уверенно предположить, что этот белок является гомологичным.
Все файлу можно найти тут: ~/public_html/prak3.9
Задание находится здесь: ~/term3/pr9/emboss.txt.
Задание находится здесь: ~/term3/pr9/edirect.sh.