Практикум 10. Программа BLAST

Гомологи белка

Для поиска гомологов использовалась программа BLAST. Были установлены следующие параметры:

  • Алгоритм blastp
  • База данных: Swiss-Prot
  • Размер выдачи: 100
  • Пороговое E-value: 0,05
  • Длина слова: 6
  • Матрица BLOSUM62
  • Штраф за гэп = 11, штраф за удлинение инделя = 1
  • Фильтры на участки малой сложности
  • Всего было 34 находки, включая исходный белок. Гиперссылка на результат поиска

    . Были отобраны следующие: P40881.1 (исходная), Q8DKB5.1, Q8YYI3.1, O30711.1, Q03513.1, P72758.1, P40882.2

    На выравнивании можно заметить, что схожесть отобранных белков между собой выше, чем с исходным белком. Они, вероятно, гомологичны друг другу, и с меньшей вероятностью гомологичны исходному белку

    Гиперссылка на выравнивание

    Работа с вирусным полипротеином

    Для работы был выбран полипротеин вируса сонной болезни (ID POLN_SLDV, AC Q8QL53). Дальнейшая работа производилась с кэпирующим ферментом (1-516 остаток) (ссылка на fasta). Для построения выравнивания были отобраны следующие белки: Q8QL53.1 - изначальный белок, Q8JJX1.1, Q9JGL0.3, P87515.3, Q5Y389.3, Q8QZ73.3. Последний белок при выравнивании показал мало сходства и был удалён.

    Гиперссылка на выравнивание

    Исследование зависимости E-value от объёма банка

    При поиске только по таксону вирусов было получено столько же результатов, сколько при поиске среди всех организмов. Значит, за пределами группы вирусов у белка не нашлось гомологов.

    Сравним E-value для одного и того же белка в двух поисках. Я выбрала для этого Q8JUX6.1. В случае поиска без фильтра его значение составило 4e-135, с фильтром - 2e-136. Значение уменьшилось в 20 раз, значит, вирусные белки составляют 1/20 (или 5%) от всех белков базы.