1. При запуске программы BLAST были использованы такие параметры как размер слова (word size - минимальная последовательность, которой ищется соответствие); матрица (matrix), определяющая, сколько баллов начисляется за выравнивание; штрафы за гэпы (gap costs); максимальное количество выравниваемых последовательностей (max target sequences); алгоритм; организм, которому принадлежит последовательность; база данных.
В выравнивании участвуют все 7 выбранных белков, вероятно, они гомологичны, потому что их последовательности имеют очень сильное сходство.
2. Я выбрал белок вируса ASFV (African swine fever virus (strain Badajoz 1971 Vero-adapted)), AC - Q65179, ID - PP62_ASFB7. Этот белок состоит из трех зрелых белков, один из них - p15 (координаты - 2-158).
Выдача программы BLAST для вирусного белка.
BLAST выдает только 4 последовательности, и они почти полностью идентичны моей.
3. После того, как я ограничил поиск вирусами, E-value в первой и второй строчка выравнивания уменьшился с 3е-111 до 1e-112. Исходя из этого, можно оченить долю вирусных белков в SwissProt: E-value=Kmn·e-λS => E2/E1=n2/n1=1/30.