Программа BLAST

1. Поиск гипотетических гомологов изучаемого белка в разных банках

Таблица 1. Результаты поиска гипотетических гомологов белка YXIM_BACSU

  Поиск по Swiss-Prot Поиск по PDB Поиск по "nr"

1. Лучшая находка (с последовательностью исходного белка)

Accession P42304.2 2O14_A YP_006632020.1
E-value 0.0 0.0 0.0
Вес (в битах) 794 733 794
Процент идентичности 100% 97% 100%

2. Число находок с E-value < 10–10

3 1 501

3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1)

Номер находки в списке описаний 6 2 927
Accession Q03045.1 1TTY_A YP_004834867.1
E-value 0.33 0.024 0.99
Вес (в битах) 36.6 34.3 40.4
% идентичности 27% 33% 28%
% сходства 44% 57% 43%
Длина выравнивания 118 52 123
Координаты выравнивания в запросе 260-370
в находке 299-413
в запросе 235-284
в находке 11-62
в запросе 260-370
в находке 247-369
Число гэпов 10 2 8

Всего находок

19 11 100

E-value последней находки

10 7,8 1e-23

Исходный белок удалось найти в Swiss-Prot и "nr", а его структуру в PDB. Наибольшее число явных гомологов нашлось среди Non-redundant protein sequences, потому что поиск шёл среди баз данных SwissProt, PIR, и PDB. Меньше всего находок в PDB, потому что относительно мало белков, структуры которых установлены.

Выход BLAST был ограничен 100 находками с E-value не больше 10. Так как находок в базах Swiss-prot и PDB меньше 100, их количество ограничено значением E-value. Поиск среди "non-redundant" последовательностей выдал 100 находок, последняя из которых имеет достаточно маленькое значение E-value, очевидно, здесь число находок ограничено размером выдачи.

2. Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам

В банке Swiss-Prot не нашлось гомологов из других таксонов, поэтому пришлось расширить зону поиска на Non-redundant protein sequences.

Таблица 1. Результаты поиска гипотетических гомологов белка YXIM_BACSU в других таксонах

Лучшая находка из царства Actinobacteria

Поиск по "nr"
Номер находки в списке описаний 1
Accession YP_002489418.1
E-value 2e-179
Вес (в битах) 503
% идентичности 68%
% сходства 81%
Длина выравнивания 354
Координаты выравнивания в запросе 26-379
в находке 43-395
Число гэпов 1

3. BLAST двух последовательностей

Рис.1. Карта локального сходства выравниваний последовательностей белка yxim и YP_002489418.1 с порогом на E-value, равным 10

Рис.2. Карта локального сходства выравниваний последовательностей белка yxim и YP_002489418.1 с порогом на E-value, равным 0.1

4. Сравнение результатов поиска с различными матрицами BLOSUM

В матрице BLOSUM90 порог клстеризации выше, чем в BLOSUM62, поэтому веса некоторых аминокислотных замен будут выше. Поэтому значения e-value так же будут выше. Однако в банке Swiss-prot всё равно не находится гомологов из других таксонов. В Non-redundant protein sequences гомологи находятся уже среди последовательностей домена Eukarya.

Таблица 3. Результаты поиска гипотетических гомологов белка YXIM_BACSU в других таксонах с использованием матрицы BLOSUM90

Лучшая находка из домена Eukarya

Поиск по "nr"
Номер находки в списке описаний 1
Accession CBY13218.1
E-value 2e-15
Вес (в битах) 88.0
% идентичности 29%
% сходства 43%
Длина выравнивания 223
Координаты выравнивания в запросе 157-377
в находке 165-369
Число гэпов 20