Практикум 10

ПОИСК ГОМОЛОГОВ БЕЛКА В SWISS-PROT

Для белка с идентификатором AC Swiss-Prot Q5JHF1 (Пантоаткиназа) запустил программу BLAST для поиска гомологичных белков.

Параметры BLAST, которые были использованы:

  • Database - UniProtKB/Swiss-Prot(swissprot) (Поиск только в базе данных Swiss-Prot)
  • Algorithm - blastp (protein-protein BLAST) (алгоритм по умолчанию)
  • Максимальный размер выдачи - 100
  • Порог на E-value - 0.05
  • Длина слова - 6 (работает быстро, но с потерей чувствительности)
  • Параметры выравнивания: BLOSUM62, Existance: 11, Extension: 1
  • Борьба с "участками малой сложности" по умолчанию
  • Ссылка на текстовую выдачу программы

    Всех находок у меня оказалось всего три, я менял параметр "Word size" на 3, а потом на 2, но находок оставалось столько же.

    Далее сделал множественное выравнивание.

    Ссылка на проект Jalview

    Я считаю, что все выровненные белки гомологичны, т.к. у них есть много участков большого сходства.

    ПОИСК ГОМОЛОГОВ ЗРЕЛОГО ВИРУСНОГО БЕЛКА, ВЫРЕЗАННОГО ИЗ ПОЛИПРОТЕИНА В SWISS-PROT

    Я выбрал полипротеин с ID POLN_ABPVR и AC Q9DSN9 организма Acute bee paralysis virus (strain Rothamsted) (ABPV).

    Далее я выбрал белок SF3 helicase, с координатами 1126-1343.

    Ссылка на последовательность белка в формате fasta

    После этого я сделал то же самое, что и в задании 1 (BLAST, отобрал 5 наилучших находок, множественное выравнивание).

    Ссылка на текстовую выдачу программы

    Ссылка на проект Jalview

    ИССЛЕДОВАНИЕ ЗАВИСИМОСТИ E-VALUE ОТ ОБЪЁМА БАНКА

    После повторного поиска с указанием viruses (taxid:10239) было найдено, на удивление, больше белков находок: 7 вместо 6.
    Можно расчитать примерную долю вирусных белков с помощью формулы

    E-value = mn*2-B

    Для находки с кодом доступа POLG_AEVCA значение E-value поменялось с 0.033 на 0.001, вес выравнивания и длина исходной последовательности не изменились и получается, что доля вирусных белков в Swiss-Prot примерно составляет 3%.

    таблица