Практикум 10

Поиск гомологов белка в Swiss-Prot

Для выполнения практикума 7 была выбрана дезоксирибозофосфатальдолаза (DEOC_PSEU2).

Для данного белка я искала гомологи в Swiss-Prot. Для этого на сайте NCBI был составлен запрос со следующими параметрами:

Database: UniProtKB/Swiss-Prot

Algorithm: blastp (protein-protein BLAST)

Max target sequences: 250

Expect threshold: 0.05

Word size: 5

Max matches in a query range: 0

Matrix: BLOSUM62

Gap costs: Existence:11 Extension: 1

Compositional adjustments: Conditional compositional score matrix adjustment

Результат поиска

Далее я выбрала 5 белков из разных организмов, для которых в программе JalView провела множественное выравнивание - файл с множественным выравниванием.

Судя по выравниванию, можно сказать, что белки гомологичны, так как аминокислотные последовательности имеют много длиных сходных участков, например, участки 66-73, 79-83, 89-106, 126-136, 145-162, 184-193.

Поиск гомологов зрелого вирусного белка, вырезанного из полипротеина, в Swiss-Prot

Был выбран белок из вируса Apple stem grooving virus (ID: POLG_ASGVP; AC: P36309; OS: Apple stem grooving virus (strain P-209) (ASGV)).

В качестве зрелого белка был выбран Putative RNA-directed RNA polymerase (helicase) с координатами 1..1868.

С помощью команды seqret 'sw:polg_asgvp[1:1868]' segment.fasta я вырезала последовательность зрелого белка в отдельный файл в fasta-формате.

файл с последовательностью

В результате работы программы BLAST к данному белку были получены 36 последовательностей, для 5 из которых сделала множественное выравнивание.

файл с 36 последовательностями

файл с множественным выравниванием

Судя по полученному выравниванию, последовательности гомологичные, так как видны большие длинные схожие участки, например, 2020-2028, 2036-2047 и 2188-2194.

Исследование зависимости E-value от объёма банка

Число находок не изменилось, ограничив поиск вирусами ((viruses (taxid:10239)), и E-value ни у одной находки не изменился, так как все найденные для выбранного белка последовательности были получены из вирусов, поэтому фильтр бесполезно ставить и не стоит ожидать изменение E-value, из-за чего долю вирусных последовательностей в Swiss-Prot нельзя посчитать по формуле E-value(с учетом таксона)/E-value(без учета таксона)*100%.