Выдача программы в текстовом файле доступна по ссылке. Для дальнейшей работы из результатов поиска я выбрал следующие AC: A5FE91.1, Q11W68.1, A6H0N4.1, C0QVH0.1, Q15YQ7.1 - эти белки были выравнены с исходным с помощью muscle и затем импортированы в Jalview(проект).
По наличию большого количества консервативных участков (столбцы 1-20, 46-131, 139-261, 273-324, 334-395; всего столбцов 406) я сделал вывод о том, что все белки - гомологичны.
Параметры поиска BLAST указаны в таблице 1.
Таблица 1. Параметры поиска BLAST | |
---|---|
Accession number | AAS11092.1 |
Database | UniProtKB/Swiss-Prot(swissprot) |
Organism | bacteria (taxid:2) |
Algorithm | blastp (protein-protein BLAST) |
Expect threshold | 0.05 |
Word size | 3 |
Matrix | BLOSUM62 |
Gap costs | Existence: 11 Extension: 1 |
Compositional adjustments | AAS11092.1 |
Filter | Low complexity regions |
В качестве таксона я выбрал bacteria, так как при введении в поле Organism отдела Spirochaetes BLAST выдавал только 2 результата, один из которых - исходный белок.
Я выбрал полипротеин вируса Human astrovirus-8. Информация о нем представлена в таблице 2.
Таблица 2. Информация о полипротеине вируса Human astrovirus-8, взятая из UniProt | |
---|---|
AC | Q9IFX2 |
ID | NS1AB_HASV8 |
Ген | ORF1 |
Рекомендуемое название | Non-structural polyprotein 1AB |
Информация о выбранном зрелом белке | |
Название | RNA-directed RNA polymerase p57 |
Координаты | 915..1417 |
Был проведен BLAST для того же вирусного белка, но на этот раз был использован фильтр по организмам - только viruses (taxid:10239)
Таблица 3. Разность в значении E-value для белка Q9JH66.2 | |
---|---|
Без фильтра на организмы | 3e-165 |
Только вирусы | 1e-166 |
Таблица показывает следущее свойство: чем больше размер банка, тем больше вероятность получить случайный результат с таким же или лучшим весом выравнивания (прочие параметры BLAST одинаковы). Доля вирусных белков в Swiss-Prot: 1e-166/3e-165 = 0.033 (3.3%)