Для выполнения практикума 7 была выбрана дезоксирибозофосфатальдолаза (DEOC_PSEU2).
Для данного белка я искала гомологи в Swiss-Prot. Для этого на сайте NCBI был составлен запрос со следующими параметрами:
Database: UniProtKB/Swiss-Prot
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 250
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap costs: Existence:11 Extension: 1
Compositional adjustments: Conditional compositional score matrix adjustment
Далее я выбрала 5 белков из разных организмов, для которых в программе JalView провела множественное выравнивание - файл с множественным выравниванием.
Судя по выравниванию, можно сказать, что белки гомологичны, так как аминокислотные последовательности имеют много длиных сходных участков, например, участки 66-73, 79-83, 89-106, 126-136, 145-162, 184-193.
Был выбран белок из вируса Apple stem grooving virus (ID: POLG_ASGVP; AC: P36309; OS: Apple stem grooving virus (strain P-209) (ASGV)).
В качестве зрелого белка был выбран Putative RNA-directed RNA polymerase (helicase) с координатами 1..1868.
С помощью команды seqret 'sw:polg_asgvp[1:1868]' segment.fasta я вырезала последовательность зрелого белка в отдельный файл в fasta-формате.
В результате работы программы BLAST к данному белку были получены 36 последовательностей, для 5 из которых сделала множественное выравнивание.
файл с 36 последовательностями
файл с множественным выравниванием
Судя по полученному выравниванию, последовательности гомологичные, так как видны большие длинные схожие участки, например, 2020-2028, 2036-2047 и 2188-2194.
Число находок не изменилось, ограничив поиск вирусами ((viruses (taxid:10239)), и E-value ни у одной находки не изменился, так как все найденные для выбранного белка последовательности были получены из вирусов, поэтому фильтр бесполезно ставить и не стоит ожидать изменение E-value, из-за чего долю вирусных последовательностей в Swiss-Prot нельзя посчитать по формуле E-value(с учетом таксона)/E-value(без учета таксона)*100%.