Entrez Direct, BLAST+, EMBOSS


Задание 1. Поиск гомологов белков в неаннотированном геноме.

В данном задании было необходимо с помощью BLAST+ сделать вывод о наличии гомолога белка в неаннотированной сборке генома Amoeboaphelidium protococcarum. Этот организм - примитивный родственник грибов. Для выполнения поставленной задачи был выбран хорошо аннотированный организм Agaricus bisporu и три аннотированных белка, принадлежащих ему: Histone H2A, DNA ligase 4, 60S ribosomal protein L42-A. Поисковый запрос UniProt для поиска белков: taxonomy:"Opisthokonta [33154]" AND reviewed:yes

Были скачены последовательности трёх белков: 1 fasta последовательность, 2 fasta последовательность, 3 fasta последовательность.

Далее был произведен поиск в локальном blast:

tblastn -query p1.fasta -db X5.fasta -out Histone_h2a.txt

tblastn -query p2.fasta -db X5.fasta -out DNA_ligase.txt

tblastn -query p3.fasta -db X5.fasta -out 60S_ribosomal.txt

С результатами можно ознакомиться ниже: Histone_h2a.txt, DNA_ligase.txt, 60S_ribosomal.txt.

Выводы:

Процент идентичности у гистона - 32%, причем покрытие чуть больше 73%, из-за этого можно в целом говорить о гомологии на этом участке. Процент идентичности лучшей находки у лигазы - 28%, хотя покрытие чуть больше 94%, что вероятно может быть подтвержением гомологии, однако не позволяет говорить об этом с большой степенью уверенности из-за невысокого процента идентичности. Процент идентичности лучшей находки у 60S рибосомального белка - 81%, и покрытие близко к 100%, поэтому скорее всего ему был найден гомолог.