Для выполнения задания практикума был выбран белок B0LIU0. Параметры программы были выбраны следующие:
Для поиска голомов в BLAST были использованы следующие параметры:
Algorithm parameters
Fasta-файл с последовательностью можно найти по ссылке.
При заданных параметров текстовая выдача программы следующая текстовая выдача.
Все белки гомологичны друг другу так как наблюдаются участки с высокой гомологией. Например участки 12-36, 92-131, 190-257. Выравнивание в Jalview.
Выбранный полипротеин:
Выбранный участок зрелого белка
Fasta-файл с последовательностью mRNA-capping enzyme nsP1 можно найти по ссылке.
При заданных параметров текстовая выдача программы следующая текстовая выдача.
В Jalview было сделано множественное выравнивание. У белков довольно много похожих участков, они гомологичны, наблюдается много высоконсервативных участков.
Был проведен аналогичный поиск, однако теперь бал дополнительно задан параметр Organism, заданное значение которого "Viruses (taxid:10239)". Число находок изменилось, поиск выдает 57 находок (без ограничения поиска вирусами - 85).
Protein AC | E-value 1 | E-value 2 |
---|---|---|
Q9IVZ9.1 | 4e-05 | 2e-06 |
P18339.2 | 8e-08 | 3e-09 |
Q6X2U4.1 | 0.004 | 2e-04 |
C помощью формулы С.Карлина E-value=Kmn·e^-λS, где n - размер базы. Из формулы видно, что E-value изменяется прямопропорциально размеру базы. Можно посчитать какую долю вирусные составляют в базе Swiss-Prot. Например для белка с AC: Q6X2U4.1 E-value2/E-value1 * 100% = 5%. Следовательно доля вирусных белков: 5%.