Программа BLAST

Поиск гипотетических гомологов изучаемого белка в разных банках

  Поиск по Swiss-Prot Поиск по PDB Поиск по "nr"

1. Лучшая находка (с последовательностью исходного белка)

Accession O05512.2 3CBW_A O05512.2
E-value 0.0 0.0 0.0
Вес (в битах) 754 718 754
Процент идентичности 100% 100% 100%

2. Число находок с E-value < 10–10

9 16 521

3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1)

Номер находки в списке описаний 11 24 757
Accession Q9KU97.1 1EZ4_A YP_003105335.1
E-value 0.032 0.80 0.96
Вес (в битах) 39.7 31.6 40.0
% идентичности 28% 33% 28%
% сходства 45% 51% 45%
Длина выравнивания 138 58 90
Координаты выравнивания (от-до, в запросе и в находке) 114-245 в запросе; 268-397 в находке 130-182 в запросе; 268-318 в находке 221-294 в запросе; 170-258 в находке
Число гэпов 14 12 17
Таблица 1. Результаты поиска гипотетических гомологов белка XXXX_BACSU

Исходный белок удалось найти во всех трех базах. А существенное различие в числе явных гомологов вызвано тем что, в базе "nr" содержится большое количестве последовательностей белков из различных баз данных, в том числе из банка "TrEMBL"[1].

Общее количество находок самого последнего запроса по базе "swissprot", "pdb" и "nr" составили 19(E-value 9.1), 26(E-value 10.0) и 862(E-value 9.6) соответственно. Во всех трех случаях число находок было лимитировано значением E-value. Чем в вашем случае было лимитировано число находок: значением E-value или заданным по умолчанию предельным размером выдачи?

Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам

Известно, что филогенетически самый далекий таксон это неклеточные организмы. Однако среди них "удовлетворительных" гомологов не нашлось. В BLAST был запрошен поиск гомологов изучаемого белка у всех клеточных организмов кроме Бактерий, как показано на рисунке 1. Наилучшие гомологи нашлись среди эукариотных организмов.

Рисунок 1. Три домена жизни

3. Лучшая находка в наиболее далеких таксонах (в данном случае Eukaryota)

  Поиск по Swiss-Prot Поиск по PDB Поиск по "nr"
Номер находки в списке описаний 1 1 4
Accession P55296.1 3ZM8_A BAL68133.1
E-value 2e-17 1e-21 6e-26
Вес (в битах) 86.3 95.1 114
% идентичности 27% 27% 32%
% сходства 46% 42% 49%
Длина выравнивания 309 335 228
Координаты выравнивания (от-до, в запросе и в находке) 4-290 в запросе; 120-395 в находке 13-327 в запросе; 123-419 в находке 55-268 в запросе; 30-244 в находке
Число гэпов 55 58 27
Таблица 2. Результаты поиска гипотетических гомологов белка XXXX_BACSU с фильтром по таксонам

BLAST двух последовательностей

Сравнение последовательностей изучаемого белка MANB1_BACSU и его гомолога Q08480.1

Рисунок 2. Карту локального сходства двух последовательностей с порогом на E-value, равным 10 Рисунок 3. Карту локального сходства двух последовательностей с порогом на E-value, равным 0.01

1. Информация о банке "TrEMBL" на моей странице "http://kodomo.fbb.msu.ru/...