Главная страница

Практикум 10

1. Поиск гомологов белка с AC O85040 в Swissprot

Параметры поиска: Enter Query Sequence: O85040
Database: Uniprotkb/Swiss-prot(swissprot)
Algorithm : blastp
Max target sequences: 100
Expect threshold: 0.05
Word size: 6
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension: 1
Compositional adjustments: Conditional compositional score matrix adjustment
Filter: Low complexity regions

Текстовоя выдача Я выбрал белки первые 6 белков из выдачи (один из них изучаемый белок), их Sequence ID: O85040.1 (изучаемый белок)
B8GQP8.1
Q8VW94.1
Q9ZHZ1.1
Q0AHW1.1
B7JB30.1
Проект Jalview
Все белки гомологичны, в выравнивании визуально видно, что большая часть аминокислотных остатков совпадает.

2. Вирус в Swissprot

Я выбоал полипротеин с:
ID GAG_HTL1M
AC P14077
OS Human T-cell leukemia virus 1

Я выблал белок PRO_0000038817
131..344
fasta-последовательность из полипротеина
За исключением последовательности все параметры поиска те же что и в упражнении 1
Текстовая выдача BLAST

Я выбрал белки со следующими AC ; и ID d в swiss-prot:
P14077.3 ; GAG_HTL1M (Выбранный белок из полипротеома)
P03345.3 ; GAG_HTL1A
P14076.3 ; GAG_HTL1C
P10274.3 ; PRO_HTL1A
P14074.3 ; PRO_HTL1C
P0C209.2 ; GAG_HTL1L
Проект Jalview Опять же из проекта видно, что все белки гомологичны.

3. Исследование зависимости E-value от объёма банка

До вбивания параметра Viruses было 40 находок, после стало 35. У P03345.3 E-value(далее просто E) изменился после использования параметра с 3e-155 до 7e-154.То есть среди всех организмов(пусть кол-во всех белков в swiss-prot = n1) E1 составило 3e-155 а только среди вирусов E2=7e-154 (пусть кол-во вирусных белков в swiss-prot n2) .Воспотльзовавшись явной формулой для E в битах получим :
n2 / n1 = E1 / E2
(т.к. мы смотрим E для одного выравнивания то m и 2**(-B) сократились)
Итак : n2/n1 = 3e-155 / 7e-154 = 0.04...
в процентах это 4 %