Найти в Swiss-Prot гомологи белка

В практикуме 7 исследовался белок A0A077HJT5_9CORY. Настраиваемые параметры поиска:

Смотреть текстовую выдачу

Выравнивание выбранных белков из выдачи: Последний белок: GLMU_MYCBP Просмотр проекта

Гомологи вирусного белка из полипротеина

Выбранный белок:

Участок зрелого белка: Последний белок:GP_HANTB Просмотр проекта

Исследование зависимости E-value от объёма банка

Добавив фильтр Viruses число результатов не изменилось, и поиск выдал старое значение - 22. Однако изменились некоторые значения E-value, которые не были "машинным нулем". К примеру, Puumala virus имело E-value = 1е-137, которое в результате поиска с фильтром изменилось на 6е-139. То есть значение уменьшилось в 0.06 раз. Из формулы E-value=K*m*n*e^(-λS), где все переменные кроме n (размер БД, суммарная длина всех последовательностей) константы , находим, что вирусные последовательности составляют ~6% от общей длины последовательностей в Swiss-Prot.