Поиск по сходству (blast)

Задание 1. Таксономия и функция данной нуклеотидной последовательности

Отчет приведен в предыдущем практикуме (7).

Задание 2. Сравнение списков находок нуклеотидной последовательности 3-я разными алгоритмами blast

Ссылка на последовательность

Поиск производил по таксону Polychaeta, т.к. результаты по низшим таксонам получались с практически одинаковым сходством и заметных различий между алгоритмами blast не было.

Таблица 1. Результаты поиска

Параметр blastn megablast discontiguous megablast
Число находок 818 500 801
E-value худшей находки 5.2 2e-57 5e-07
Query cover худшей находки 3% 69% 11%
Сходство худшей находки 100% (16) 81% (228) 85% (39)

Вывод: у megablast высокие требования к E-value, Query cover не может быть ниже 28 нуклеотидов (не находит короткие последовательности). Megablast можно использовать для поиска только гомологичных последовательностей

Только blastn выдал кучу находок с высоким E-value 5.2, например, в Gattyana ciliata 28S large subunit ribosomal RNA gene. Query cover (16) недостаточен для megablast, а для discontiguous megablast, возможно, не подошел паттерн.

Discontiguous blast и blastn выдали много находок, не найденных megablast, например Owenia fusiformis histone H3 (H3) gene (в выравнивании нет паттерна из 28 последовательных нуклеотидов)

Задание 3. Проверка наличия гомологов пяти белков в геноме организма X5 (Amoboaphelidium)

Ссылка на сборку
Моя главная страница
© Sergey Starikov, 2015