Практикум 10
1. Найдите в Swissprot гомологи вашего белка
Мой белок - CAA42196.1
При запуске были использованы следующие параметры :
Enter Query Sequence: CAA42196.1
Databade: UniProtKB/Swiss-Prot(swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Expect threshold: 0.05
Word size: 6
Matrix: BLOSUM62
Gap costs: Existence: 11 Extension: 1
Filter: Low complexity regions
Текстовая выдача программы доступна по ссылке
В выдаче 9 белков . Среди них я выбрал 6 : P11568.2 ( исходный белок ) ; G3KIM5.1 ; Q93AM0.1 ; Q5U925.1 ; P39383.2 ; Q60315.1 .
Cсылка на множественное выравнивание этих белков. У них много консервативных участков , потому я думаю что они все гомологичны .
2. Найдите в Swissprot гомологи зрелого вирусного белка, вырезанного из полипротеина
Был выбран полипротеин со следующими характеристиками:
ID: POLN_SAGV
AC: Q9JGL0 ; Q9JGK9
OS: Sagiyama virus (SAGV)
Для дальнейшей работы я выбрал белок Protease nsP2 с координатами 535-1332 .
Ссылка на фрагмент последовательности.
При запуске были использованы те же параметры , то упомянуты выше . Ссылка на текстовую выдачу программы.В результате выдачи я получил 31 белок. Среди них я выбрал 6: Q9JGL0.3 (исходная последовательность), Q5Y389.3 , P13887.2 , P08411.2 , Q8QZ73.3 , P13886.2 .
Ссылка на множественное выравнивание этих белков . Они однозначно гомологичны.
3. Исследование зависимости E-value от объёма банка
Я выполнил аналогичный запрос, но в этот раз применил фильтр по организмам (Viruses (taxid:10239)) . В результате запроса я получил 33 белка. Пример белка, изменившего свое E-value - Q08534.2 . Его значения при запросе без ограничений - 2e-06 , а с ограничением - 9e-08. То есть оно стало меньше.
E-value(vir)/E-value * 100% = 4.5%