Задание 1

Поиск гомологов белков в неаннотированном геноме

Для выполнения BLAST+ были выбраны протеины принадлежащие трем хорошо аннотированным видом из подцарства Dikarya

А имменно витально важные для эукариотического метаболизма белки, которые, с наибольшей вероятностью могут быть найдены в нашей последовательности:

DNA-dependent RNA polymerase II, partial [Ascobolus denudatus] => Выдача BLAST+

Pyridoxal kinase [Pneumocystis murina B123] => Выдача BLAST+

Translation elongation factor 1-alpha, partial [Chrysomyxa arctostaphyli] => Выдача BLAST+

Белки были получены скачиванием с сайта NCBI на kodomo при помощи команды seqret. Пример использования:

seqret embl:"AAS86840" -outseq polymeraseII.fasta

Blast запускался с ограничением по E-value, однако результаты показали, что это было необязательно:

tblastn -query elongationfactor.fasta -db X5.fasta -out results/elongationfactor.txt -evalue 0.001

В выдаче к каждому белку присутствуют находки с крайне малым E-value, высокой идентичностью и показателями покрытия, близкими к полному, из чего делаем вывод, что каждый из выбраных белков представлен в нашей сборке хотя бы гомологией.

Задание 2 и 3 выполнены на кодомо