Учебный сайт Корляковой Марии

EMBOSS

Поиск гомологов белков в неаннотированном геноме

Чтобы найти белки для исследования в сборке генома Amoeboaphelidium protococcarum была установлена и использована программа BLAST+. Как источник референсных последовательностей был взят организм Encephalitozoon cuniculi (strain GB-M1), являющийся представителем близкородственного к Aphelida таксона Microsporidia, а также хорошо аннотированный.

Поисковой запрос: taxonomy:"encephalitozoon cuniculi" AND reviewed:yes)

Три последовательности его белков были использованы для запросов:

Последовательности, необхадимые для BLAST+, были загружены с сайта Uniprot (Basket→Download→Go) и переименованны в файлы вида [protein key].fasta, файл X5.fasta, скопирван на домашний компьютер.

Сперва для работы с BLAST+ была создана локальная база данных из сборки:
makeblastdb -in X5.fasta -dbtype nucl

Запросы к полученной базе данных осуществлялись с помощью tblastn следующей командой:
tblastn -query [protein key].fasta -db fungi.fasta -out [protein key].txt -evalue 0.1

Результаты

Главный транскрипционный и ДНК-репарационный фактор 2H домен XPB хеликазы

Выдача: RAD25.txt
Были найдены две самые лучшие находки с идентичностью 61%. E-value для обеих находок был равен 0.0. Эти данные говорят о гомологии последовательностей.

мРНК кэп-гуанин-N7 метилтрансфераза

Выдача: MCES.txt
Всего было показано две находки с идентичностью 33% и 29% и E-value равным 2е-09 и 3е-12 соответсвенно. Найденные скэффолды покрывают частично совпадающие участки запроса. Возможно, найденные последовательности гомологичны искомой.

Фактор элонгации 2

Выдача: EF2.txt
Было найдено довольно много скэффолдов, два из которыз имеют E-value равный 0.0 и идентичность 45% и 43%. Оба скэффолда покрывают последовательность запроса почти полностью. Очень вероятно данный белок консервативен.