Практикум 10:

Отбор гомологичных к Тетанотоксину из Clostridium tetani E88 белков при помощи алгоритма BLAST:

В данном практикуме мы будем искать гомологи к Тетанотоксину, который мы обозревали ранее в практикуме №7, в базе данных Swiss-prot, используя алгоритм BLAST, на картинке ниже вы можете наблюдать параметры алгоритма при которых выполнялись задания данного практикума.

phosphatase phosphatase

Ниже представлены ссылки на результаты выдачи алгоритма blastp, а также результаты множественного выравнивания в формате jvp.

Обзор гомологов зрелого Вирусного белка:

phosphatase

Для начала в качестве полипротеина, я решил выбрать полипротеин Хантаанского вируса, штамма хойо (Hojo). Данный полипротеин состоит из 1134 аминокислот, он разрезается пептидазой между 648 и 649 остатками на два гликопротеина: Glycoprotein N и Glycoprotein C. При помощи пакета EMBOSS, мы получили отдельную последовательность гликопротеина N (19-648 остатки оригинального полипротеина), после чего поместили её в BLAST чтобы в последствии провести множественное выравнивание полученным гомологов.

Ниже представленны ссылки на последовательность зрелого гликопротеина N в текстовом формате, а также результаты множественного выравнивания в формате jvp.

Зависимость E-value от величины банка.

Поскольку для гликопротеина из предыдущего задания значения E-value гомологов слишком малы, для задания №3 мной было принято решение использовать мембранный белок 1 вируса герпеса человека (Вирус Эпштейна-Барра первого типа) и уже на его гомологах рассмотреть изменение E-value.

phosphatase

В таблице выше вы можете наблюдать значения E-value гомологов выбранного нами белка в случае запуска алгоритма BLAST без уточнения таксона. Тогда как в таблице ниже вы можете видеть значения E-value, полученные в результате запуска алгоритма при рассмотрении только вирусных белков. В данном случае величина банка последовательностей с которыми производится сравнение значительно меньше, чем в случае, когда мы не уточняем таксон. Это подтверждает, что значение E-value прямо пропорционально величине банка. phosphatase

Как вы можете видеть, для одного из гомологов (3 строка) значение E-value уменьшилось в 30 раз, из чего можно предположить, что приблизительно 1/30 часть всех белков в Swiss-prot вирусные. На 15.05.2023, в Swiss-prot содержится информация о приблизительно 569516 белках, одна тридцатая от этого числа составляет 18984 (33,33%). Реальное число вирусных белков в Swiss-prot 17320 (30,41%) отклонение в три процента в данном случае можно считать допустимым.