Учебный Сайт Николая Николаева

Программа BLAST

1. Поиск гомологов белка в SwissProt.

Параметры программы:

Результат доступен по ссылке. Было построено выравнивание исходного белка с дегидратазами и циклоизомеразами из Saccharolobus solfataricus (Q97U96.1), Salmonella enterica (Q8ZL58.1), Vibrio sp. (H2IFX0.1), Agrobacterium fabrum (A9CEQ8.1) и Xanthomonas campestris (Q8P3K2.1). Хотя последовательности идентичны лишь на небольших участках, выделяются консервативные блоки, например, с координатами 248-286.

2. Поиск гомологов зрелого вирусного белка, вырезанного из полипротеина.

Для исследования был выбран полипротеин P1234 венесуэльского вируса лошадиного энцефалита

и содержащаяся в нём протеаза nsP2 (Protease nsP2, координаты: 536..1329).

Параметры те же, что в п.1.

Результат доступен по ссылке. Для выравнивания были выбраны полипротеины следующих вирусов: Sagiyama virus (Q9JGL0.3), Getah virus (Q5Y389.3), Ross river virus (P13887.2), Mayaro virus (Q8QZ73.3), Igbo Ora virus (O90370.1). Выравнивание доступно по ссылке. Гомология зрелых протеинов очевидна, поскольку большинство колонок консервативны. Их положение в полипротеинах также примерно одинаково.

3. Исследование зависимости E-value от объёма банка.

Для поиска по всей базе данных E-value для метилтрансферазы/хеликазы/РНК-зависимой РНК-полимеразы вируса кустистой карликовости малины (см. здесь) равен 5*10-9, для поиска только по вирусам (см. здесь) - 2*10-10. Таким образом, последовательности вирусов составляют примерно 2*10-10/5*10-9=0.04 от общей длины Swiss-Prot.