Практикум 9. Entrez Direct, BLAST+, EMBOSS.

Задание 1. Поиск гомологов белков в неаннотированном геноме.

Amoeboaphelidium protococcarum является представителем группы Aphelida, которая является родственной грибам. В качестве родственного организма был выбран представитель группы Ascomycota Penicillium chrysogenum. Поиск белков осуществлялся с использованием UniProt поисковым запросом:

taxonomy:penicillium chrysogenum AND reviewed:yes

Поиск осуществлялся только среди последовательностей аннотированных вручную (reviewed:yes). В качестве белков были выбраны: топоизомераза 2, 2 субъединица АТФ-синтазы и тиоредоксин. Все они отвечают за фундаментальные процессы, происходящие в клетках и являются широко рапространенными среди эукариот, в частности, присутствуют у человека.

Их последовательности были получены командой:

seqret uniprot:{AC} {AC}.fasta

База для поиска была создана командой:

makeblastdb -in X5.fasta -dbtype nucl

Для поиска белковых последовательностей по нуклеотидной базе была использована программа tblastn:

tblastn -query {AC}.fasta -db X5.fasta -out {AC}.out

Для топоизомеразы 2 было найдено 2 последовательности, которые можно считать гомологами в связи с ничтожно низким E-value, достаточно высоким процентом схожести и наличием совпадающих участков по всей длине выравнивания.

Ссылка на последовательность

Ссылка на выдачу

Для 2 субъединицы АТФ-синтазы было найдено 4 совпадения, из которых только 1 можно более или менее достоверно считать гомологичной последовательностью, так как только у нее достаточно низкий E-value и выравнивание имеет достаточную длину. Можно предположить, что остальные 3 являются доменами, выполняющими схожую функцию, что и один из доменов 2 субъединицы АТФ-синтазы.

Ссылка на последовательность

Ссылка на выдачу

Для тиоредоксина было найдено 22 совпадения, но только для 12 из них можно предположить гомологию, так как для остальных слишком высокий E-value (>0.05), и длина выравниваний значительно меньше, чем длина тиоредоксина.

Ссылка на последовательность

Ссылка на выдачу