Программа BLAST

1. Поиск в Swissprot гомологов белка

Параметры при запуске BLAST

Enter Query Sequence: CCE23001.1
Database: UniProtKB/Swiss-Prot(swissprot).
Algorithm: blastp (protein-protein BLAST).
Max target sequences: 100
Expect threshold: 0.05
Word size: 6
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension: 1
Filter: Low complexity regions

Выдача программы в виде текста . Так как при выдачи выпало много результатов, то я буду работать с WP_014147797.1, XP_012758567.1, PYN29230.1, MBI5480091.1, MBL8635142.1, WP_224191928.1, MBN2078343.1.
Множественное выравние по ссылке . Все белки являются гомологичными, т. к. имеется много конссервативных участков.

2. Поиск в Swissprot гомологов зрелого вирусного белка, вырезанного из полипротеина

Параметры полипротеина

ID: GAG_MLVFP
AC: P26805
OS: Friend murine leukemia virus (isolate PVC-211) (FrMLV)

Выбран зрелый белок RNA-binding phosphoprotein p12(РНК-связывающий фосфопротеин р12) с координатами [132-215]. С помощью программы eqret из EMBOSS был вырезан из полипротеина в отдельный файл fasta-формата. Получино множественное выравнивание по ссылке .

3. Исследование зависимости E-value от объёма банка

В предыдущий запрос (из задания 2) добавила фильтр по организмам, поиск ограничился до вирусов.
Список находок не изменился. Значения для белков с исходно ненулевыми e-value изменились. Для P26805.3 1e-31 => 4e-33 - уменьшилось в 25 раз. Для P0DOH5.1 6e-30 => 2e-31 - уменьшилось в 30 раз. Доля вирусных белков Swissprot, примерно равную 0,03(3)-0,04, т.е. 3,3 % - 4 %.