BLAST

Гомологи белка

В 7 практикуме я выбрала белок ATP-dependent helicase из бактерии Lactobacillus amylovorus GRL1112, однако по нему не было ничего найдено с помощью BLAST, поэтому я буду использовать другой белок. tRNA-specific 2-thiouridylase MnmA (AC: P25745)

При запуске BLAST были заданы следующие параметры:

Database: UniProtKB/Swiss-Prot (swissprot)

Algorithm: blastp (protein-protein BLAST)

Max target sequences: 100

Expect threshold: 0.05

Word size: 5

Max matches in a query range: 0

Matrix: BLOSUM62

Gap costs: Existence: 11 Extension: 1

Compositional adjustments: Conditional compositional score matrix adjustment

Текстовая выдача программы

В программе Jalview было выполнено множественное выравнивание первых 7 белков:

Проект Jalview

Все последовательности - гомологи белка, поскольку в выравнивании нет гэпов, замены аминокислот редкие и на схожие по свойствам остатки, а консервативные участки очень длинные

Гомологи зрелого вируса

Был выбран вирус:

ID: GP_PUUMS

AC: P27312

Название вируса: Puumala virus

Выбранный полипротеин:

Название: Glycoprotein C

Координаты: 659-1148

Последовательность белка

Параметры при запуске BLAST:

Database: UniProtKB/Swiss-Prot (swissprot)

Algorithm: blastp (protein-protein BLAST)

Max target sequences: 100

Expect threshold: 0.05

Word size: 5

Max matches in a query range: 0

Matrix: BLOSUM62

Gap costs: Existence: 11 Extension: 1

Compositional adjustments: Conditional compositional score matrix adjustment

Текстовая выдача программы

Выполнено множественное выравнивание первых 5 белков

Проект Jalview

Белки гомологичны практически по всей длине

Исследование зависимости E-value от объема банка

При запуске BLAST были сохранены почти все параметры за исключением Organism (Organism: Viruses (taxid:10239))

Текстовая выдача программы

22 находки

Количество находок не изменилось, однако значение E-value поменялось в некоторых белках

Сравнительная таблица белков:

Белок Значение E-value без ограничений Значение E-value с ограничениями
Q09120.1 3e-151 1e-152
A6XIP3.1 0.008 3e-04
Q8JSZ3.1 0.029 0.001

При поиске с ограничением, значение E-value уменьшилось в трех белках белках. Было посчитано соотношение E-value с ограничением и без, оно приблизительно равно 0.035. Поскольку менялся только один параметр, то можно сделать вывод, что отношение E-value равно отношению размеров баз данных. Вирусные белки составляют приблизительно 3.5% от белков всех организмов