Задание 1.

В этом задании необходимо было отыскать гомологи белков в неаннотированном геноме Amoeboaphelidium protococcarum. Поскольку этот организм является примитивным родственником грибов, поэтому отыщем в Uniprot аннотированные белки данного таксона:

taxonomy:"Fungi [4751]" AND reviewed:yes

Затем выберем три белка, которые с высокой долей вероятности есть у эукариот. Для проверки зададим запрос:

name:"name_protein" taxonomy:"Eukaryota [2759]" AND reviewed:yes

Скачаем последовательности с помощью пакета программ EMBOSS:

seqret "sw:protein_ID" seq.fasta

Далее создаём базу из генома Amoeboaphelidium protococcarum с помощью пакета BLAST+:

makeblastdb -in X5.fasta -dbtype nucl

Запускаем локальный BLAST:

tblastn -query seq.fasta -db X5.fasta -out seq_blast.out

Выдача BLAST: Transcription elongation factor SPT6, Succinate dehydrogenase assembly factor 2, SAGA-associated factor 29.

По этим результатам можно сделать вывод, что у дегидрогеназы, возможно, есть гомолог, закодированный в геноме Amoeboaphelidium protococcarum. Об этом говорит процент идентичности, равный 44%, при низком E-value для двух находок. Для находок остальных двух белков процент идентичности примерно 25-26%, так что гомологии выявить нельзя.

Задание 3.

AC вируса: EU100883, для которого проверялась работа скрипта; AC сборки: GCA_018350175.1 (из седьмого практикума. Ссылки с выдачей: первый конвейер, второй конвейер, третий конвейер.