Практикум 10

1. Гомологи в Swissprot Pyridoxamine--pyruvate transaminase белка бактерии Mesorhizobium japonicum

Для поиска в BLAST я использовал параметры:
AC: BAE48518.1;
База данных: Swiss-Prot;
Oрганизм: —;
Алгоритм: blastp;
Максимальное кол-во отображаемых последовательностей: 100;
Short queries: off;
Пороговое значение для E-value: 0.01;
Word size: 3;
Ограничение на кол-во результатов, совпадающих с запросом: 0;
Матрица: BLOSUM62;
Штрафы за введение и продление инделя: 11,1;
Compositional adjustments: conditional compositional score matrix adjustment;
Фильтр для участков малой сложности: включён;
Mask for lookup table only: off;
Mask lower case letters: off;

Текстовая выдача программы с 100 результатами доступна по ссылке. Я выбрал свой белок (Q988B8.1) и ещё 7 из выдачи, отсортированной по возрастанию E-value. Множественное выравнивание (Muscle with Defaults) было сделано в программе JalView, а его результат достуупен в виде файла .jvp по ссылке. Как можно видеть, все последовательности обладают высоким уровнем сходства, есть много консервативных позиций с совпадающими аминокислотными остатками по всей длине белка, что свидетельствует о гомологии и подтверждается низкими значениями E-value для выбранных последовательностей (менее 1*10-35).

2. Гомологи зрелого вирусного белка в Swissprot, вырезанного из полипротеина

Мною был выбран полипротеин Вирус острого паралича пчел (штамм Rothamsted):
ID: POLN_ABPVR
AC: Q9DSN9
OS: Acute bee paralysis virus (strain Rothamsted) (ABPV).

Среди белков, на которые разрезается полипротеин, я выбрал RdRp catalytic с координатами в полипротеине: 1638..1772.Файл с последовательностью в формате FASTA доступен по ссылке. Множественное выравнивание первых 6 белков из выдачи BLAST в формате проекта JalView доступно по ссылке.

3. Исследование зависимости E-value от объёма банка

При указании таксона Viruses (taxid:10239) кол-во находок увеличилось с 51 до 64.
Для O36966 полипротеина с кодом доступа C0MHL9 значение E-value поменялось с 6*10^(-23) на 2*10^(-24).
Из формулы E-value=mn*2^(-B) , в которой m - длина исходной последовательности; n – размер базы данных; B - вес в битах, следует, что при неизменной m: n1/n1=E1/E2.
Выходит, что доля вирусных белков в базе данных Swiss-Prot примерно равна 3.33%