Практикум 10

1. Поиск гомологов Альфа-глюкозидазы.

Для белка с идентификатором INSDC CDS CAA04524.1 (Alpha-glucosidase) по AC Swiss-Prot (O33830) была запущена программа BLAST для поиска гомологичных белков.

Параметры поиска:

1) Database - UniProtKB/Swiss-Prot(swissprot)

2) Algorithm - blastp (protein-protein BLAST)

3) Максимальный размер выдачи - 100

4) Expect threshold - 0.05

5) Word size - 6

6) Параметры выравнивания: BLOSUM62, Existance: 11, Extension: 1

7) Фильтры на участки малой сложности

Всего было найдено 12 последовательностей. Из них было выбрано 5 с наименьшим E-value и составлено множественное выравнивание.

Я думаю, что все белки являются гомологами, т.к. у всех пяти процент индентичности больше 20%. Из выравнивания видно, что у них есть достаточно похожие участки (например, 9-20, 37-52).

Ссылка на текстовую выдачу программы

Ссылка на проект Jalview

2. Поиск гомологов зрелого вирусного белка, вырезанного из полипротеина в Swiss-Prot.

Был выбран полипротеин с ID POL1_CPMVS (AC P03600) организма Cowpea mosaic virus (strain SB) (CPMV). Далее с помощью программы seqret был вырезан фрагмент полипротеина Viral genome-linked protein с координатами начала и конца 948 и 1155.

Ссылка на последовательность белка в формате fasta.

Было найдено 13 белков, из которых было выбрано 5 (не включая исходный) для анализа.

Ссылка на текстовую выдачу программы

Ссылка на проект Jalview

3. Исследование зависимости E-value от объёма банка

После повторного поиска было найдено 18 белков. Добавились находки с высоким значением E-value.

Для сравнения значений E-value использовала белок P35930.1. E-value изменилось с 3*10^(-73) до 1*10^(-74). Значение уменьшилось в 0.03 раз, следовательно, доля SwissProt вирусов равна 3.3%.