Цель задания: с помощью BLAST+ сделать вывод о наличии гомолога белка в неаннотированной сборке генома Amoeboaphelidium protococcarum.
Для этого была создана локальная база данных X5.fasta, полученная из заданной неаннотированной сборки генома.
makeblastdb -in X5.fasta -dbtype nucl
Для поиска гомологов нужно было выбрать организм, близкий к рассматриваемому Amoeboaphelidium protococcarum и хорошо аннотированый. Поскольку в классе Aphelidea, а затем и в кладе Aphelida не было найдено подходящих организмов, был использован модельный организм Saccharomyces cerevisiae , который, как и исследуемый организм, относится к царству Fungi , кладе Opisthokonta .
Были выбраны следующие 3 белка Saccharomyces cerevisiae :
1) актин
3) DNA-directed RNA polymerase
Ниже можно посмотреть команды для поиска, скачивания последовательностей и запуска программы blast.
seqret 'sw:P60010' actin.fasta
seqret 'sw:P53378' tubulin.fasta
seqret 'sw:P10964' RNApol.fasta
tblastn -query actin.fasta -db X5.fasta > actin_result.txt
tblastn -query tubulin.fasta -db X5.fasta > tubulin_result.txt
tblastn -query RNApol.fasta -db X5.fasta > RNApol_result.txt
name:actin organism:"saccharomyces cerevisiae strain atcc 204508 s288c"
name:tubulin organism:"saccharomyces cerevisiae strain atcc 204508 s288c"
name:rna polymerase organism:"saccharomyces cerevisiae strain atcc 204508 s288c"
белок | лучшие находки | E-Value находок соответственно | процент идентичности | покрытие |
Actin | scaffold-17, scaffold-444, scaffold-514 | 0.0, 0.0, 0.0 | 89%, 89%, 89% | 100%, 100%, 100% |
Tubulin gamma chain | scaffold-423 | 2e-57 | 35% | 95% |
DNA-directed RNA polymerase I subunit RPA190 | scaffold-44, scaffold-100 | 1e-177, 3e-171 | 42%, 41% | 96%, 96% |
С помощью выданных программой файлов была составлена таблица для исследуемых белков. Опираясь на таблицу, можно сделать вывод о том, что у Amoeboaphelidium protococcarum точно имеются гомологи актина и ДНК-зависимой РНК-полимеразы Saccharomyces cerevisiae , поскольку были получены выравнивания с нулевыми и ничтожно малыми E-Value, а также достаточно большими процентами покрытия и индентичности. В случае тубулина все менее очевидно, но так как был получен достаточно большой E-Value и процент идентичности более 30%, можно предположить, что у исследуемого организма все-таки имеется гомолог гамма цепи тубулина.
Выдачу blast можно найти ниже:
1) актин