BLAST+, EMBOSS, Entrez

Поиск гомологов белков в неаннотированном геноме

Для поиска трех белков, свойственных эукариотам, в сборке генома Amoeboaphelidium protococcarum были использованы последовательности белков Saccharomyces cerevisae, модельного организма из близкого царства Fungi.

Было выбрано три белка, кодируемых генами домашнего хозяйства: альфа-енолаза (ENO1_YEAST), фумараза (FUMH_YEAST) и каталитическую субъединицу А ДНК-полимеразы альфа (DPOA_YEAST).

Записи были найдены следующим образом:

ENO1_YEAST
fumarase organism:"saccharomyces cerevisiae"
dna polymerase alpha subunit b organism:"saccharomyces cerevisiae"
        
И загружены:
seqret sw:eno1_yeast eno1.fasta
seqret sw:fumh_yeast fumh.fasta
seqret sw:_yeast eno1.fasta
        

Выравнивания были построены со следующими входными данными и параметрами:

makeblastdb -in X5.fasta -dbtype nucl
tblastn -query eno1.fasta -out eno1.txt -evalue 0.05 -db X5.fasta
tblastn -query fumh.fasta -out fumh.txt -evalue 0.05 -db X5.fasta
tblastn -query dpoa.fasta -out dpoa.txt -evalue 0.05 -db X5.fasta
        

По итогам поиска лучших выравниваний были сделаны следующие выводы:

Все три белка определенно присутствуют в сборке генома. Однако в отличие от остальных рассмотренных белков с относительно высокой консервативностью каталитическая субъединица А ДНК-полимеразы альфа оказалась гораздо менее консервативной.