При запуске BLAST были использованы следующие параметры:
Database: UniProtKB/Swiss-Prot (swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Expect treshold: 0,05
Wordsize: 6
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension: 1
Compositional adjustments: Conditional compositional score matrix
По ссылке можно скачать файл с текстовой выдачей ответа на запрос.
Скачать выравнивание можно по ссылке. Сложно сказать являются ли белки гомологами друг друга, так как есть несколько консервативных участков, а также много инделей. Стоит отметить более высокую парную схожесть H1AE13.1 [Aspergillus fumigatus] и I1BTD7.1 [Rhizopus delemar] ; Q6L6S1.1 [Hydra vulgaris] и Q9GV16.1 [Cyanea nozakii]. Она определяется близким таксономическим положением.
Я выбрала полипротеин Beet mosaic virus (BtMV) с АС: Q6XW15 и ID: POLG_BTMV.
Для его поиска использовался запрос: name:polyprotein mosaic virus AND reviewed:yes
Далее я выбрала белок капсида (Capsid protein) этого вируса с координатами 2810-3085.
По ссылке можно скачать последовательность этого белка.
Множественное выравнивание первых 6 белков из выдачи BLAST доступно по ссылке. Последовательности почти полностью совпали, так что они гомологи. Это неудивительно, всё это белки довольно простого капсида мозаичных вирусов.
При укзании таксона Viruses количество находок не изменилось (всё те же 49 последовательностей). Это связано с тем, что белки капсида характерны только для вирусов.
Для геномного полипротеина с кодом доступа P20235.1 значение E-value поменялось с 3е-123 на 1е-124, а вес выравнивания и длина последовательности не изменились. Тогда вирусные белки составляют 1/30 от всех белков в swissprot, то есть 3,33%.