Практическая работа 10

Задание 1

Для поиска гомологов фермента 5'-дезоксиаденозиндезаминазы(A0A0E3Q5B4_9EURY) из Methanosarcina vacuolata Z-761 был запущен BLAST со следующими параметрами:

  • Database: UniProtKB/Swiss-Prot
  • Algorithm: blastp (protein-protein BLAST)
  • Expect threshold: 0.05
  • Word size: 5
  • Matrix: BLOSUM62
  • Max target sequences: 100
Файл с текстовой выдачей можно скачать по ссылкe .

Для множественного выравнивания были выбраны следующие 7 гомологов:

  1. C6A048.1 Thermococcus sibiricus MM 739
  2. Q8TYD4.1 Methanopyrus kandleri AV19
  3. Q8U0P7.1 Pyrococcus furiosus DSM 3638
  4. A3DEQ2.1 Acetivibrio thermocellus ATCC 27405
  5. Q2FRU6.1 Methanospirillum hungatei JF-1
  6. Q72B14.1 Nitratidesulfovibrio vulgaris str. Hildenborough
  7. B7IS56.1 Bacillus cereus G9842

Файл с множественым выравниванием этих 7 гомологов с исходной последовательностью Methanosarcina vacuolata Z-761 можно скачать по ссылкe .

Все 8 аминокислотных последовательностей имеют следующие сходные участки: 85-95, 128-142, 205-212, 230-240, 265-276, 290-303, 315-345. Большинство инделей находятся в начале и на конце последовательностей, в середине же их число незначительно. Таким образом, можно однозначно утверждать, что все 8 ферментов гомологичны.

Задание 2

Для выполнения этого задания задания был выбран полипротеин Replicase polyprotein 1ab(ID – R1AB_CVMJH, AC – P0C6Y0) из Murine coronavirus (strain JHM) (MHV-JHM) (Murine hepatitis virus). В качетсве зрелого белка я выбрал Helicase nsp13[5389:5988]. Последовательность вырезанного из полипротеина зрелого белка в fasta-формате доступна по ссылкe . С помощью BLAST были найдены 42 гомолога. Из них я отобрал следующие 6 полипротеинов для множественного выравнивания с первым зрелым белком:

  1. P0C6W7.1 Bovine enteric coronavirus (strain 98TXSF-110-ENT)
  2. P0C6X4.1 Human coronavirus HKU1 (isolate N5)
  3. P0C6X7.1 Severe acute respiratory syndrome-related coronavirus
  4. P0C6Y1.1 Avian infectious bronchitis virus (strain Beaudette)
  5. Q98VG9.2 Feline infectious peritonitis virus (strain 79-1146)
  6. P0C6X5.1 Human coronavirus NL63
Полученное выравнивание можно скачать по ссылкe . Все 7 последовательностей гомологичны, потому что они имеют крупные участки схожести по всей длине.

Задание 3

Ниже представлены значение E-value для выравнивания последовательности зрелого белка из задания 2 и полипротеина Berne virus при поиске с помощью BLAST без учета и с учетом таксономической принадлежности(Viruses (taxid:10239)):

  • Первый запрос BLAST без учета таксона: Berne virusE-value = 1e-06
  • Второй запрос BLAST с учетом таксона: Berne virusE-value = 4e-08
Исходя из теоремы С. Карлина, E-value ~ N(где N-суммарная длина последовательности базы данных, по которой идет поиск). Отсюда получаем очевидную формулу: Nвирусов/Nвсех организмов = E-valueс учетом таксона/E-valueбез учета таксона

Таким образом, доля вирусных последовательностей в Swiss-Prot составляет примерно 4%.