Для выполнения BLAST+ были выбраны протеины принадлежащие трем хорошо аннотированным видом из подцарства Dikarya
А имменно витально важные для эукариотического метаболизма белки, которые, с наибольшей вероятностью могут быть найдены в нашей последовательности:
DNA-dependent RNA polymerase II, partial [Ascobolus denudatus] => Выдача BLAST+
Pyridoxal kinase [Pneumocystis murina B123] => Выдача BLAST+
Translation elongation factor 1-alpha, partial [Chrysomyxa arctostaphyli] => Выдача BLAST+
Белки были получены скачиванием с сайта NCBI на kodomo при помощи команды seqret. Пример использования:
seqret embl:"AAS86840" -outseq polymeraseII.fastaBlast запускался с ограничением по E-value, однако результаты показали, что это было необязательно:
tblastn -query elongationfactor.fasta -db X5.fasta -out results/elongationfactor.txt -evalue 0.001В выдаче к каждому белку присутствуют находки с крайне малым E-value, высокой идентичностью и показателями покрытия, близкими к полному, из чего делаем вывод, что каждый из выбраных белков представлен в нашей сборке хотя бы гомологией.