Белковое выравнивание.
Сервис Protein BLAST.
Гомологи киназы А стрессового ответа бактерии Paracidovorax citrulli
в базе данных Swiss-Prot.
В практикуме 7 сам белок бактерии Paracidovorax citrulli находится не в базе данных Swiss-Prot, а в TrEMBL.
Так как данный белок находится не в базе данных Swiss-Prot, мне пришлось
загружать в окно программы не его AC, а просто аминокислотную последовательность.
В качестве базы данных для поиска, как уже было сказано ранее, использовалась
Swiss-Prot. Окно с организмами (Organism) и пункты с исключениями (Exclude) я оставил
нетронутыми. В качестве алгоритма поиска использовался blastp (protein-protein BLAST).
Параметры алгоритмов тоже не изменялись: максимальное количество последовательностей в выдаче 100;
включена автоматическая размера слов и других параметров (Short queries) включена;
E.value меньше 0.05; длина слова (затравки) 5; нет ограничения совпадений (Max matches in a query range
); матрица выравнивания - BLOSUM62; штраф за индель - 11 и за его удлинение - 1; В качестве метода
корректировки матрицы выравнивания - Conditional compositional score matrix adjustment; все опции в фильтровании и маскировании (Filters and Masking) отключены.
В результате былы получены 6 белков - выдача BLAST.
Далее, при помощи алгоритма множественного выравнивания Muscle было получено выравнивание данных 7 белков.
После этого данное выравнивание было загружено в JalView.
Нахождение гомологов зрелого вирусного белка,
вырезанного из полипротеина, в Swiss-Prot.
Случайным образом я выбрал поллипротеин c AC: POLN_ABPVR, который принадлежит вирусу острого
паралича пчел (Acute bee paralysis virus). Из полпротеина я решил "вырезать" домен хеликазы (513..692 ак).
При помощи seqret последовательность домена хеликазы была "вырезана" в файл.
Далее с помощью данной последовательности был осуществлен поиск схожих последовательностей
в программе Protein BLAST. Результат представлен в файле.
Далее программой Muscle было осуществелнно множественное выравнивание 8 последовательностей (1 исходная, домена хеликазы
и 7 первых последовательностей полипротеинов, полученных в BLAST).
После этого результат был загружен и обработан в JalView - проект JalView.
Исследование зависимости E-value от объёма банка.
При поиске последовательности белка только по вирусам вывод программы не изменился но изменились значения E-value. Например, для второй строки (Replicase polyprotein Cricket paralysis virus Teleogryllus) он был изначально равен 6e-34 и стал 2e-35, то есть умешился в 30 раз. То есть приблизительно вирусные белки занимают 3,33% от всех белков в базе данных Swiss-Prot.