BLAST+
Поиск гомологов белков в неаннотированном геноме Amoeboaphelidium protococcarum
Для данного задания я выбрал три белка, принадлежащие организму Saccharomyces cerevisiae, так как этот организм очень хорошо изучен:
Неаннотированная сборка генома
Amoeboaphelidium protococcarum
Поисковой запрос:
- organism:"saccharomyces cerevisiae" AND reviewed:yes
Команды для получения последовательностей белков:
- seqret 'sw:P00549' PK1.fasta
- seqret 'sw:P36006' mio3.fasta
- seqret 'sw:P08417' fum1.fasta
Создание локальной базы данных:
- makeblastdb -in X5.fasta -dbtype nucl
Поиск гомологов белков по локальной базе данных:
- tblastn -query PK1.fasta -db X5.fasta > PK_result.txt
- tblastn -query mio3.fasta -db X5.fasta > mio_result.txt
- tblastn -query fum1.fasta -db X5.fasta > fum_result.txt
Результаты:
- PK_result.txt
- имеются две находки с E-value менее 1е-160 и 54% идентичности при этом покрытие практически полное, что позволяет сделать вывод о наличии гомологичного белка в сборке генома
- mio_result.txt
- имеются две находки с E-value = 0 и 42%, 35% идентичности соответственно при этом покрытие практически полное, на основе этого можно предположить наличие в сборке гомологичного белка, однако он будет иметь значимые отличия в последовательности аминокислот
- fum_result.txt
- выдача указывает только на одну находку с E-value = 0 и 66% идентичности при этом покрытие практически полное, что позволяет сделать вывод о наличии в сборке генома гомологичного белка со схожей аминокислотной последовательностью