Программа BLAST
Описание параметров выравнивания BLAST
Subquery range - рассматриваемая часть последовательности
Database - банк последовательностей
Program - программа для поиска
Max target sequences (100) - максимальный размер выдачи
Short queries - для коротких последовательностей
автоматически применить соответствующие им параметры.
Expect threshold (0.05) - максимальный E-value находок
Word size (5) - размер слова(якоря)
Max matches in a query range (0) - ограничение по совпадающим буквам в промежутке
Matrix (BLOSUM62) - выбор матрицы
Gap Costs (Existence: 11 Extension: 1) - настройки штрафа за открытие и продолжение инделя.
Low complexity regions filter - учесть участки малой сложности
Выдача Blast для белка из практикума 7
Выравнивание
Гомологи вирусного белка
Hantaan virus
ID GP_HANTL
AC P16853
Query:
Note: Glycoprotein C
Range: 649..1135
Выдача Blast
Вырывнивание(Tcoffee)
fasta
Оценка доли вирусных белков
Нет, не изменился.
P41264(Puumala virus strain berkel)
Выдача при поиске по всем организмам Eval=3*10^-128
Выдача при поиске по вирусам Eval=10^-129
E-value прямо пропорциональна размеру банка. Из этого следует, что доля
белков вирусов в банке: 10^-129/(3*10^-128)*100% = 3.3%