Выдача программы в текстовом файле доступна по ссылке. Для дальнейшей работы из результатов поиска я выбрал следующие AC: A5FE91.1, Q11W68.1, A6H0N4.1, C0QVH0.1, Q15YQ7.1 - эти белки были выравнены с исходным с помощью muscle и затем импортированы в Jalview(проект).
По наличию большого количества консервативных участков (столбцы 1-20, 46-131, 139-261, 273-324, 334-395; всего столбцов 406) я сделал вывод о том, что все белки - гомологичны.
Параметры поиска BLAST указаны в таблице 1.
| Таблица 1. Параметры поиска BLAST | |
|---|---|
| Accession number | AAS11092.1 |
| Database | UniProtKB/Swiss-Prot(swissprot) |
| Organism | bacteria (taxid:2) |
| Algorithm | blastp (protein-protein BLAST) |
| Expect threshold | 0.05 |
| Word size | 3 |
| Matrix | BLOSUM62 |
| Gap costs | Existence: 11 Extension: 1 |
| Compositional adjustments | AAS11092.1 |
| Filter | Low complexity regions |
В качестве таксона я выбрал bacteria, так как при введении в поле Organism отдела Spirochaetes BLAST выдавал только 2 результата, один из которых - исходный белок.
Я выбрал полипротеин вируса Human astrovirus-8. Информация о нем представлена в таблице 2.
| Таблица 2. Информация о полипротеине вируса Human astrovirus-8, взятая из UniProt | |
|---|---|
| AC | Q9IFX2 |
| ID | NS1AB_HASV8 |
| Ген | ORF1 |
| Рекомендуемое название | Non-structural polyprotein 1AB |
| Информация о выбранном зрелом белке | |
| Название | RNA-directed RNA polymerase p57 |
| Координаты | 915..1417 |
Был проведен BLAST для того же вирусного белка, но на этот раз был использован фильтр по организмам - только viruses (taxid:10239)
| Таблица 3. Разность в значении E-value для белка Q9JH66.2 | |
|---|---|
| Без фильтра на организмы | 3e-165 |
| Только вирусы | 1e-166 |
Таблица показывает следущее свойство: чем больше размер банка, тем больше вероятность получить случайный результат с таким же или лучшим весом выравнивания (прочие параметры BLAST одинаковы). Доля вирусных белков в Swiss-Prot: 1e-166/3e-165 = 0.033 (3.3%)