Семестры

Белковое выравнивание.
Сервис Protein BLAST.

Гомологи киназы А стрессового ответа бактерии Paracidovorax citrulli
в базе данных Swiss-Prot.

В практикуме 7 сам белок бактерии Paracidovorax citrulli находится не в базе данных Swiss-Prot, а в TrEMBL.

Так как данный белок находится не в базе данных Swiss-Prot, мне пришлось загружать в окно программы не его AC, а просто аминокислотную последовательность. В качестве базы данных для поиска, как уже было сказано ранее, использовалась Swiss-Prot. Окно с организмами (Organism) и пункты с исключениями (Exclude) я оставил нетронутыми. В качестве алгоритма поиска использовался blastp (protein-protein BLAST).
Параметры алгоритмов тоже не изменялись: максимальное количество последовательностей в выдаче 100; включена автоматическая размера слов и других параметров (Short queries) включена; E.value меньше 0.05; длина слова (затравки) 5; нет ограничения совпадений (Max matches in a query range ); матрица выравнивания - BLOSUM62; штраф за индель - 11 и за его удлинение - 1; В качестве метода корректировки матрицы выравнивания - Conditional compositional score matrix adjustment; все опции в фильтровании и маскировании (Filters and Masking) отключены.

В результате былы получены 6 белков - выдача BLAST.

Далее, при помощи алгоритма множественного выравнивания Muscle было получено выравнивание данных 7 белков.
После этого данное выравнивание было загружено в JalView.

С уверенностью можно сказать, что все 7 белков гомологичны. Важно отметить, что те 6 белков, которые были получены при помощи BLAST практически не отличаются друг от друга и в тоже время сильнее отличаются от киназы Paracidovorax citrulli. Это может быть связано с тем, что 6 полученных белков принадлежат близкородственным бактериям: 2 из белков принадлежат двум различным штаммам Escherichia coli, еще три принадлежат трем штамма Salmonella enterica. Оставшийся белок принадлежит бактерии Shigella flexneri. Несложно узнать, что Paracidovorax относится к кладе Betaproteobacteria, в то время как Escherichia coli, Salmonella enterica и Shigella flexneri - к кладе Gammaproteobacteria - отсюда и малые различия между между 6 белками, и сильные отличия всех 6 белков от белка Paracidovorax citrulli.

Нахождение гомологов зрелого вирусного белка,
вырезанного из полипротеина, в Swiss-Prot.

Случайным образом я выбрал поллипротеин c AC: POLN_ABPVR, который принадлежит вирусу острого паралича пчел (Acute bee paralysis virus). Из полпротеина я решил "вырезать" домен хеликазы (513..692 ак). При помощи seqret последовательность домена хеликазы была "вырезана" в файл. Далее с помощью данной последовательности был осуществлен поиск схожих последовательностей в программе Protein BLAST. Результат представлен в файле.
Далее программой Muscle было осуществелнно множественное выравнивание 8 последовательностей (1 исходная, домена хеликазы и 7 первых последовательностей полипротеинов, полученных в BLAST). После этого результат был загружен и обработан в JalView - проект JalView.

Исследование зависимости E-value от объёма банка.

При поиске последовательности белка только по вирусам вывод программы не изменился но изменились значения E-value. Например, для второй строки (Replicase polyprotein Cricket paralysis virus Teleogryllus) он был изначально равен 6e-34 и стал 2e-35, то есть умешился в 30 раз. То есть приблизительно вирусные белки занимают 3,33% от всех белков в базе данных Swiss-Prot.