Blast

Таблица 1. Характеристики выдачи blast для ANF53595.1
Характеристика Значение
Кол-во находок 233
Кол-во находок E≤0.001 229
Максимальное E-value 9.7
Тип лимита выдачи E-value
Таблица 2. Характеристики выдачи blast для ANF53595.1, длинна слова 2
Характеристика Значение
Кол-во находок 243
Кол-во находок E≤0.001 229
Максимальное E-value 9.7
Тип лимита выдачи E-value

Отличия этого результата только в количестве находок. Причем, добавились находки с E-value>0.001.

Задание 3

Для следующего задания выбран белок UDP-3-O-acyl-GlcNAc deacetylase (AC: Q12SC1, E-value=7e-90), class Gammaproteobacteria

Найдено 127 белков. E-value выбранного: 1e-90, обусловлен в 7 раз меньшим объемом базы поиска. Bit-score и score не изменились.

Задание 4

Таблица 3. Сравнение web-интерфейсов BLAST
Характеристика Европейский биоинформатический институт UniProt NCBI
Базы данных поиска

Широкий выбор баз Uniprot, патентов. Есть PDB и некоторые другие

Только UniProt

PDB, UniProt, базы NCBI

Форматы вводимой последовательности

Не поддерживает ввод идентификаторов баз данных. Есть загрузка файлов

UniProt ID или последовательность

RefSeq, AC

Алгоритмы BLAST

blastp и blastx

blastp

quick blastp, blastp, psi-blast, phi-blast, delta-blast

Доп. параметры

Уведомление по email

Настройка многих парметров: от длинны слова до фильтров

Задание 5

Выполнено для белка из второго задания (ANF53595.1). Поиск в UniProt, стандартные параметры.

E-value Pam250 всегда больше E-value Blossum62. Коэффициент корреляции Спирмана пары E-value Blossum и разницы составляет -0.894, то есть чем больше E, тем сильнее оно уменьшается после замены матрицы на Pam250. Данные

Таблица 4.Корреляция Спирмана
E-value, Blossum E-value, Pam Difference
E-value, Blossum 1.000000 0.89391 -0.893881
E-value, Pam 0.893910 1.00000 -1.000000
Difference -0.893881 -1.00000 1.000000

© Бушмакин Илья, 2018