EMBOSS
Поиск гомологов белков в неаннотированном геноме
Чтобы найти белки для исследования в сборке генома Amoeboaphelidium protococcarum была установлена и использована программа BLAST+. Как источник референсных последовательностей был взят организм Encephalitozoon cuniculi (strain GB-M1), являющийся представителем близкородственного к Aphelida таксона Microsporidia, а также хорошо аннотированный.
Поисковой запрос: taxonomy:"encephalitozoon cuniculi" AND reviewed:yes)
Три последовательности его белков были использованы для запросов:
- Главный транскрипционный и ДНК-репарационный фактор 2H домен XPB хеликазы (RAD25_ENCCU)
- мРНК кэп-гуанин-N7 метилтрансфераза (MCES_ENCCU)
- Фактор элонгации 2 (EF2_ENCCU)
Последовательности, необхадимые для BLAST+, были загружены с сайта Uniprot (Basket→Download→Go) и переименованны в файлы вида [protein key].fasta, файл X5.fasta, скопирван на домашний компьютер.
Сперва для работы с BLAST+ была создана локальная база данных из сборки:
makeblastdb -in X5.fasta -dbtype nucl
Запросы к полученной базе данных осуществлялись с помощью tblastn следующей командой:
tblastn -query [protein key].fasta -db fungi.fasta -out [protein key].txt -evalue 0.1
Результаты
Главный транскрипционный и ДНК-репарационный фактор 2H домен XPB хеликазы
Выдача: RAD25.txt
Были найдены две самые лучшие находки с идентичностью 61%. E-value для обеих находок был равен 0.0. Эти данные говорят о гомологии последовательностей.
мРНК кэп-гуанин-N7 метилтрансфераза
Выдача: MCES.txt
Всего было показано две находки с идентичностью 33% и 29% и E-value равным 2е-09 и 3е-12 соответсвенно. Найденные скэффолды покрывают частично совпадающие участки запроса. Возможно, найденные последовательности гомологичны искомой.
Фактор элонгации 2
Выдача: EF2.txt
Было найдено довольно много скэффолдов, два из которыз имеют E-value равный 0.0 и идентичность 45% и 43%. Оба скэффолда покрывают последовательность запроса почти полностью. Очень вероятно данный белок консервативен.