Ввиду поиска среди генов в сборке гомологов для белков необходимо прибегнуть к tblastn и поиску в SwissProt белков из близкородственных организмов. Так как они родственны грибам, то разумно будет провести поиск белков среди грибов. Я воспользовался следующим запросом: taxonomy:"Fungi [4751]" existence:"Evidence at protein level [1]". В основном, белки были представлены для дрожжей, поэтому мой выбор пал именно на них.
Теперь необходимо прибегнуть к помощи бласт с помощью следующей команды: tblastn -task tblastn -query *.fasta -db X5.fasta -out *.out. FASTA-файлы были получены с помощью команды seqret sw:*AC* *.fasta.
Для первого белка был получен следующий результат.
Характеристика находки: Score = 533 bits (1373), Expect = 9e-172, Identities = 264/418 (63%), Positives = 335/418 (80%), Gaps = 5/418 (1%) Frame = +3
Исходя из количества идентичных и синонимичных позиций можно сделать вывод о гомологичности найденной последовательности.
Для второго белка был получен следующий результат.
Характеристика находки: Score = 689 bits (1778), Expect = 0.0, Identities = 343/657 (52%), Positives = 459/657 (70%), Gaps = 14/657 (2%) Frame = +1
Исходя из количества идентичных и синонимичных позиций можно сделать вывод о гомологичности найденной последовательности.
Для третьего белка был получен следующий результат.
Характеристика находки: Score = 946 bits (2446), Expect = 0.0, Identities = 529/1109 (48%), Positives = 738/1109 (67%), Gaps = 51/1109 (5%) Frame = +1
Исходя из количества идентичных и синонимичных позиций можно сделать вывод о гомологичности найденной последовательности.
Таким образом, для всех выбранных мной белков в неаннотированном геноме Amoeboaphelidium protococcarum были найдены гомологи.