Для белка с идентификатором INSDC CDS CAA04524.1 (Alpha-glucosidase) по AC Swiss-Prot (O33830) была запущена программа BLAST для поиска гомологичных белков.
Параметры поиска:
1) Database - UniProtKB/Swiss-Prot(swissprot)
2) Algorithm - blastp (protein-protein BLAST)
3) Максимальный размер выдачи - 100
4) Expect threshold - 0.05
5) Word size - 6
6) Параметры выравнивания: BLOSUM62, Existance: 11, Extension: 1
7) Фильтры на участки малой сложности
Всего было найдено 12 последовательностей. Из них было выбрано 5 с наименьшим E-value и составлено множественное выравнивание.
Я думаю, что все белки являются гомологами, т.к. у всех пяти процент индентичности больше 20%. Из выравнивания видно, что у них есть достаточно похожие участки (например, 9-20, 37-52).
Ссылка на текстовую выдачу программыСсылка на проект Jalview
Был выбран полипротеин с ID POL1_CPMVS (AC P03600) организма Cowpea mosaic virus (strain SB) (CPMV). Далее с помощью программы seqret был вырезан фрагмент полипротеина Viral genome-linked protein с координатами начала и конца 948 и 1155.
Ссылка на последовательность белка в формате fasta.
Было найдено 13 белков, из которых было выбрано 5 (не включая исходный) для анализа.
Ссылка на текстовую выдачу программыСсылка на проект Jalview
После повторного поиска было найдено 18 белков. Добавились находки с высоким значением E-value.
Для сравнения значений E-value использовала белок P35930.1. E-value изменилось с 3*10^(-73) до 1*10^(-74). Значение уменьшилось в 0.03 раз, следовательно, доля SwissProt вирусов равна 3.3%.