BLAST+, EMBOSS

1. Поиск гомологов белков в неаннотированном геноме

Требовалось найти гомологи трех широко распространенных у эукариот белков в неаннотированном геноме Amoeboaphelidium protococcarum. Первым шагом надо было узнать АС интерессующих меня белков в близкородственных организмах. Поиск производился по всем грибам, т.к. в этом случае намного проще найти проверенные записи. Для этого использовался следующий запрос в Uniprot:

taxonomy:"Fungi [4751]" name:"protein_name"
Ссылки на белковые последовательности: Далее с помощью команды seqret последовательности белков были загружены на kodomo:
seqret -filter sw:protein_AC(ID) seqname.fasta
Локальная база, состоящая из генома Amoeboaphelidium protococcarum, была создана с помощью команды makeblastdb:
makeblastdb -in X5.fasta -dbtype nucl
Последний этап – запуск tblastn:
tblastn -query seqname.fasta -db X5.fasta > outfile.txt

Результаты

Выдача BLAST:

Можно сделать вывод, что геном организма содержит гены, кодирующие три выбранных белка. Для саб-юнита ДНК-зависимой РНК полимеразы нашлись две хорошиие находки (scaffold-300 и scaffold-157) с E-value 0 и процентами идентичности 52 и 53, весами выравнивания 1565 и 1447 соответственно. Для первой находки площадь покрытия немного выше, чем для второй (88% против 81%), что склоняет нас к выводу, что большая часть гена белка уместилась на скэффолде-300. Из всего этого можно предположить, что в геноме присутствует гомолог белка.

В случае хеликазы также есть находка с довольно низким Е-value (3e-106), процентом идентичности 43, площадью покрытия 60. Вполне вероятно, что в геноме содержится ген, кодирующий гомолог хеликазы дрожжей.

Актин уместился полностью на скэффолде, процент идентичности достаточно высокий (89%), что гоаорит о том, что в геноме Amoeboaphelidium protococcarum действительно причутствует гоиолог актина.