При запуске BLAST были использованы следующие параметры:
Database: UniProtKB/Swiss-Prot (swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Expect treshold: 0,05
Wordsize: 6
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension: 1
Compositional adjustments: Conditional compositional score matrix
По ссылке можно скачать файл с текстовой выдачей ответа на запрос.
Выбранные мной пять белков почти точно гомологичны моему (много консервативных участков). Скачать выравнивание можно по По ссылке.
Выбрынный полипротеин - вируса клещевого энцефалита (Tick-borne encephalitis virus (strain Hypr) (TBEV) [70733])
ID: POLG_TBEVH
AC: Q01299
Название белка: Capsid protein C
Локация в полипротеине: 1-96
Текстовая выдача (11 находок).
Выравнивание с 6-тью находками.
Думаю, все находки в выравнивании гомологичны заданному белку (все, кроме последней, имеют очень много одинаковых участков, про последний - непонятно: с одной стороны сходных участков мало, с другой явно видны два консервативных дуплета аргинина (17-18 и 102-103) и консервативный мотив LRK (81 - 83), а также мало гэпов, что скорее свидетельствует в пользу гомологии).
Количество находок не поменялось (вполне ожидаемо, что белки капсида характерны только для вирусов :)). Для всех находок E-value уменьшилось от 25 до 30 раз. Поскольку это значение прямо пропорционально размеру базы, можно сделать вывод, что вирусы сотавляют около 3,6 % всей базы данных.