Практикум 10
Поиск гомологов белка в Swiss-Prot
В практикуме 7 мною был выбран белок L36 большщй рибосомальной субъединицы bL36.
Параметры поиска:
Данные белки гомологичны.
Поиск гомологов зрелого вирусного белка, вырезанного из полипротеина в Swiss-Prot
Мною был выбран POLN_ABPVR репликазный полипротеин вируса острого паралича пчел. ID:POLN_ABPVR, AC:Q9DSN9. Зрелый белок - Peptidase C3, распологающийся с 1638 до 1772 ак. fasta-файл Пептидазы С3
Исследование зависимости E-value от объёма банка
Если поставить фильтр для поиска по вирусам, то количество результатов останется равным 17. Но некоторые E-value изменились, например у Q9IJX4.1 E-value изначально было 1е-30, а стало 5е-30. По теореме Карлина, которая связывает длину последовательности и размер базы данных, мы можем найти долю вирусных белков в базе данных, поделив E-value с фильтром на E-value без фильтра. Получается 5*10^(-30)/1*10^(-28) = 0.05, соответственно 5%, если считать относительно Q9IJX4.1.