Практикум 10. Программа BLAST

Использование BLAST. Гомологи белка CTP synthase организма Albidiferax ferrireducens T118 (Rhodoferax ferrireducens T118)

Категория Параметр Значение
General parameters Database Swiss-Prot
AC (accession) Q21V39
Max target sequences 5000
Short queries включено (auto-adjust parameters for short sequences)
Expect threshold (E-value) 0.1
Word size 3
Max matches in a query range 0
Scoring parameters Substitution matrix BLOSUM62
Gap costs Existence: 11, Extension: 1
Compositional adjustments Conditional compositional score matrix adjustment
Filters and masking Low complexity filter выключен
Masking не применялось
Mask for lookup table only не использовалось
Mask lower case letters не использовалось
Параметры запуска BLAST (Protein BLAST, Swiss-Prot database)

Текстовая выдача BLAST

С помощью программ EMBOSS был создан файл с 8 последовательностями белков. Было выполнено множественное выравнивание с помощью программы MUSCLE и загружено в Jalview для дальнейшего анализа.

По результатам анализа стоит отметить, что длины исследуемых белков различались: Большинство последовательностей содержали около 160–210 аминокислотных остатков, тогда как длина исходного белка составляла 555 аминокислот, а ещё одной последовательности - 501 аминокислотный остаток.

Несмотря на различия в длине, белки содержали общие консервативные и функционально сходные участки, что позволяет предположить их гомологичность.

Однако белок YRAA_BACSU, вероятно, является более удалённым гомологом, поскольку его последовательность заметно выпадала из одного из консервативных участков выравнивания (колонки 558–562).

Выравнивание JalView

Поиск в Swiss-Prot гомологов зрелого вирусного белка, вырезанного из полипротеина

Параметр Значение
ID SPIKE_BCHK4
AC A3EX94
OS (Организм) Bat coronavirus HKU4 (BtCoV/HKU4/2004)
CHAIN Spike protein S2
Координаты 750–1235
Характеристика выбранного вирусного полипротеина и зрелого белка

Последовательность зрелого белка

Результат выдачи BLAST

Выравнивание гомологов зрелого вирусного белка

В множественном выравнивании наблюдаются консервативные участки, что указывает на гомологичность рассматриваемых последовательностей.

В целом результаты BLAST и характер выравнивания подтверждают, что белки являются гомологами, но c разной степенью эволюционного родства

Исследование зависимости E-value от объёма банка

Я повторила BLAST-поиск с теми же параметрами, но ограничила базу только вирусными последовательностями, чтобы сравнить изменения E-value.

В качестве примера взяла один и тот же белок Q6Q1S2 : в полной базе его E-value было 1e-79, после фильтра стало 5e-81. Так как изменение E-value пропорциональной изменению размера баз, можно оценить, какую долю базы занимают вирусы - у меня получилось значение около 5%

Результат выдачи BLAST после изменения размера базы