Entrez Direct, BLAST+, EMBOSS

Поиск гомологов белков в неаннотированном геноме

Цель задания: с помощью BLAST+ сделать вывод о наличии гомолога белка в неаннотированной сборке генома Amoeboaphelidium protococcarum.

Для этого была создана локальная база данных X5.fasta, полученная из заданной неаннотированной сборки генома.

makeblastdb -in X5.fasta -dbtype nucl

Для поиска гомологов нужно было выбрать организм, близкий к рассматриваемому Amoeboaphelidium protococcarum и хорошо аннотированый. Поскольку в классе Aphelidea, а затем и в кладе Aphelida не было найдено подходящих организмов, был использован модельный организм Saccharomyces cerevisiae , который, как и исследуемый организм, относится к царству Fungi , кладе Opisthokonta .

Были выбраны следующие 3 белка Saccharomyces cerevisiae :

1) актин

2) тубулин (гамма цепь)

3) DNA-directed RNA polymerase

Ниже можно посмотреть команды для поиска, скачивания последовательностей и запуска программы blast.

seqret 'sw:P60010' actin.fasta

seqret 'sw:P53378' tubulin.fasta

seqret 'sw:P10964' RNApol.fasta

tblastn -query actin.fasta -db X5.fasta > actin_result.txt

tblastn -query tubulin.fasta -db X5.fasta > tubulin_result.txt

tblastn -query RNApol.fasta -db X5.fasta > RNApol_result.txt

name:actin organism:"saccharomyces cerevisiae strain atcc 204508 s288c"

name:tubulin organism:"saccharomyces cerevisiae strain atcc 204508 s288c"

name:rna polymerase organism:"saccharomyces cerevisiae strain atcc 204508 s288c"

Обсуждение результатов

Table 1. Actin, Tubulin gamma chain, DNA-directed RNA polymerase I subunit RPA190
белок лучшие находки E-Value находок соответственно процент идентичности покрытие
Actin scaffold-17, scaffold-444, scaffold-514 0.0, 0.0, 0.0 89%, 89%, 89% 100%, 100%, 100%
Tubulin gamma chain scaffold-423 2e-57 35% 95%
DNA-directed RNA polymerase I subunit RPA190 scaffold-44, scaffold-100 1e-177, 3e-171 42%, 41% 96%, 96%

С помощью выданных программой файлов была составлена таблица для исследуемых белков. Опираясь на таблицу, можно сделать вывод о том, что у Amoeboaphelidium protococcarum точно имеются гомологи актина и ДНК-зависимой РНК-полимеразы Saccharomyces cerevisiae , поскольку были получены выравнивания с нулевыми и ничтожно малыми E-Value, а также достаточно большими процентами покрытия и индентичности. В случае тубулина все менее очевидно, но так как был получен достаточно большой E-Value и процент идентичности более 30%, можно предположить, что у исследуемого организма все-таки имеется гомолог гамма цепи тубулина.

Выдачу blast можно найти ниже:

1) актин

2) тубулин (гамма цепь)

3) DNA-directed RNA polymerase