ПРАКТИКУМ 10
Найти в Swiss-Prot гомологи белка
В практикуме 7 исследовался белок Outer membrane protein P1. Из Swiss-Prot скачаем последовательность в формате .fasta и загрузим ее в окошке “enter query sequence” на сайте BLAST. Затем настроим параметры поиска:
- Database: swissprot
- Algorithm: blastp
- General parameters: 1000; 0.05; 5; 0
- Scoring Parameters: BLOSUM62; Existence: 11 Extensions: 1; Conditional compositional score
Программа выдало всего 1 находку, по этой причине я поменяла белок на Isocitrate dehydrogenase [NADP]. Уже для этого белка было найдено с теми же параметрами 250 находок (смотреть текстовую выдачу). Из этого списка я выбрала 7 находок с минимальным значением E-Value отличным от 0.0
Далее в программе JalView провела множественное выравнивание исходного белка и выбранных находок (ссылка на проект)
Делая вывод исходя из результатов выравнивания белков, хочу отметить, что данные находки гомологичные, поскольку наблюдается много высоконсервативных участков (35-43, 46-50, 108-133, 135-143, 143-153, 165-177, 213-219, 234-267, 370-379, 405-416).
Найдите в Swiss-Prot гомологи зрелого вирусного белка, вырезанного из полипротеина
Выбранный полипротеин:
- ID: GP_PHV
- AC: P27315
- OS: Prospect Hill virus (PHV)
Выбранный участок зрелого белка
- Участок: [655-1142]
- Название: Glycoprotein C
Fasta-файл с последовательностью Glycoprotein C можно найти по ссылке
В результате применения программы BLAST к последовательности Glycoprotein C было найдено всего 22 результата (смотреть на текстовую выдачу). Далее я отобрала 5 находок и провела множественное выравнивание в программе JalView (ссылка на проект)
Выровненные последовательноти были проанализированы. Исходя из анализа, можно сделать вывод, что все последовательности являются гомологичными, так как наблюдается большое количество ярко выраженных консервативных участков.
Исследование зависимости E-value от объёма банка
Был проведен аналогичный поиск, однако теперь бал дополнительно задан параметр Organism, заданное значение которого "Viruses (taxid:10239)". Число находок не изменилось, поиск выдает все те же 22 находки. При использовании BLAST без ограничения организмов значение E-value для находки P41266.1 составило 1e-173, а при использовании ограничения (поиск среди вирусов) - 6e-175. Следовательно, доля последовательностей, относящихся к вирусам, составляет ~6%