Программа BLAST позволяет выполнить поиск гомологов рассматриваемого белка. Для осуществения поиска по AC моего белка были выбраны следующие параметры:
Полученные гомологи доступны по ссылке. Затем, для проведения множественного выравнивания были выбраны 6 гомологов, резулататы которого можно увидеть в файле. Рассматриваемые белки по большей части полностью консервативны: в всех последовательностях напротяжении всей длины(1-382) встречаются только единичные несовпадения.
Для выполнения этого задания была выбрана последовательность белка mRNA-capping enzyme nsP1 из полипротеина POLN_SLDV. Далее был выполнен поиск возможных гомологов (находки) данной цепи по параметрам, идентичным параметрам первого упражнения. Выбрав 5 белков и проведя выравнивание (результат выравнивания), было обнаружено, что, даннные белки могут быть гомологичными, поскольку в них встречаютсяконсервативные участки: 337-388, 357-361, 371-378.
Для выполнения данного задания параметры были оставлены прежними, однакобыл добавлен фильтр про организмам. Для последующего анализа был выбран полипротеин AC:P87515.3. Его значение Е равняется 1e-146, в то время как Е при поиске без фильтра по организмам равняется 3e-145. Согласно теореме Крлина, E-value = K * m * n * e^(-λ * S), где K и λ – константы, m – длина исходной последовательности, n – размер базы данных, S – вес выравнивания. В таком случае, для белков Swiss-Prot E-value(вируса) / E-value(общ)=1e-146/3e-145=0,03. Получив данное значение, мы можем сделать вывод, что вирусные белки занимают около 3% Swiss-Prot.