BLAST
Гомологи белка
В 7 практикуме я выбрала белок ATP-dependent helicase из бактерии Lactobacillus amylovorus GRL1112, однако по нему не было ничего найдено с помощью BLAST, поэтому я буду использовать другой белок. tRNA-specific 2-thiouridylase MnmA (AC: P25745)
При запуске BLAST были заданы следующие параметры:
Database: UniProtKB/Swiss-Prot (swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap costs: Existence: 11 Extension: 1
Compositional adjustments: Conditional compositional score matrix adjustment
Текстовая выдача программы
В программе Jalview было выполнено множественное выравнивание первых 7 белков:
Проект JalviewВсе последовательности - гомологи белка, поскольку в выравнивании нет гэпов, замены аминокислот редкие и на схожие по свойствам остатки, а консервативные участки очень длинные
Гомологи зрелого вируса
Был выбран вирус:
ID: GP_PUUMS
AC: P27312
Название вируса: Puumala virus
Выбранный полипротеин:
Название: Glycoprotein C
Координаты: 659-1148
Последовательность белкаПараметры при запуске BLAST:
Database: UniProtKB/Swiss-Prot (swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap costs: Existence: 11 Extension: 1
Compositional adjustments: Conditional compositional score matrix adjustment
Текстовая выдача программы
Выполнено множественное выравнивание первых 5 белков
Проект JalviewБелки гомологичны практически по всей длине
Исследование зависимости E-value от объема банка
При запуске BLAST были сохранены почти все параметры за исключением Organism (Organism: Viruses (taxid:10239))
Текстовая выдача программы22 находки
Количество находок не изменилось, однако значение E-value поменялось в некоторых белках
Сравнительная таблица белков:
| Белок | Значение E-value без ограничений | Значение E-value с ограничениями |
|---|---|---|
| Q09120.1 | 3e-151 | 1e-152 |
| A6XIP3.1 | 0.008 | 3e-04 |
| Q8JSZ3.1 | 0.029 | 0.001 |
При поиске с ограничением, значение E-value уменьшилось в трех белках белках. Было посчитано соотношение E-value с ограничением и без, оно приблизительно равно 0.035. Поскольку менялся только один параметр, то можно сделать вывод, что отношение E-value равно отношению размеров баз данных. Вирусные белки составляют приблизительно 3.5% от белков всех организмов