Для выполнения задания было решено искать хорошо аннотированные белки более менее родственного организма, из таксона Opistokonta среди грибов и им подобных, наиболее изученным организмом является Saccharomyces cerevisiae.
Прежде всего была создана локальная база данных:
makeblastdb -in X5.fasta -dbtype nuclПолучили базу в виде файлов "X5.fasta.nhr", "X5.fasta.nin" и "X5.fasta.nsq", по которой можно искать программами blastn и tblastn.
Как известно, самые консервативные белки играют важную роль в основных метаболитических процессах, например в гликолизе, в организации цитоскелета, в жизненном цикле. Их и будем искать.
taxonomy:"Saccharomyces cerevisiae (Baker's yeast) [4932]" act1 AND reviewed:yesКоманда получения белковой последовательности:
seqret "uniprot:P60010" P60010.fastaссылка на последовательность
Команда поиска гомологов белка:
tblastn -query "P60010.fasta" -db "X5.fasta" -out "act.txt"ссылка на выдачу BLAST+
Можно предположить, что последовательности актина, судя по всему присутствующая в Amoeboaphelidium protococcarum, и Saccharomyces cerevisiae гомологичны, т.к. очнь низкий e-value 0.0 и процент идентичности 89%.
taxonomy:"Saccharomyces cerevisiae (Baker's yeast) [4932]" "pyruvate kinase 2" reviewed:yesКоманда получения белковой последовательности:
seqret "uniprot:P52489" P52489.fastaссылка на последовательность
Команда поиска гомологов белка:
tblastn -query "P52489.fasta" -db "X5.fasta" -out "pyr.txt"ссылка на выдачу BLAST+
Можно предположить, что последовательности Пируваткиназы 2, судя по всему присутствующая в Amoeboaphelidium protococcarum, и Saccharomyces cerevisiae гомологичны, т.к. очнь низкий e-value 7e-166 и процент идентичности 54%, что достаточно для белков.
taxonomy:"Saccharomyces cerevisiae (Baker's yeast) [4932]" "pyruvate kinase 2" reviewed:yesКоманда получения белковой последовательности:
seqret "uniprot:P00546" P00546.fastaссылка на последовательность
Команда поиска гомологов белка:
tblastn -query "P00546.fasta" -db "X5.fasta" -out "cycle.txt"ссылка на выдачу BLAST+
Можно предположить, что последовательности циклинзависимой киназы 1, судя по всему присутствующая в Amoeboaphelidium protococcarum, и Saccharomyces cerevisiae гомологичны, т.к. очнь низкий e-value 5e-88 и процент идентичности 51%, что достаточно для белков.