Поиск гипотетических гомологов изучаемого белка в разных банках
Поиск по Swiss-Prot | Поиск по PDB | Поиск по "nr" | |
1. Лучшая находка (с последовательностью исходного белка) |
|||
Accession | O05512.2 | 3CBW_A | O05512.2 |
E-value | 0.0 | 0.0 | 0.0 |
Вес (в битах) | 754 | 718 | 754 |
Процент идентичности | 100% | 100% | 100% |
2. Число находок с E-value < 10–10 |
9 | 16 | 521 |
3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1) |
|||
Номер находки в списке описаний | 11 | 24 | 757 |
Accession | Q9KU97.1 | 1EZ4_A | YP_003105335.1 |
E-value | 0.032 | 0.80 | 0.96 |
Вес (в битах) | 39.7 | 31.6 | 40.0 |
% идентичности | 28% | 33% | 28% |
% сходства | 45% | 51% | 45% |
Длина выравнивания | 138 | 58 | 90 |
Координаты выравнивания (от-до, в запросе и в находке) | 114-245 в запросе; 268-397 в находке | 130-182 в запросе; 268-318 в находке | 221-294 в запросе; 170-258 в находке |
Число гэпов | 14 | 12 | 17 |
Исходный белок удалось найти во всех трех базах. А существенное различие в числе явных гомологов вызвано тем что, в базе "nr" содержится большое количестве последовательностей белков из различных баз данных, в том числе из банка "TrEMBL"[1].
Общее количество находок самого последнего запроса по базе "swissprot", "pdb" и "nr" составили 19(E-value 9.1), 26(E-value 10.0) и 862(E-value 9.6) соответственно. Во всех трех случаях число находок было лимитировано значением E-value. Чем в вашем случае было лимитировано число находок: значением E-value или заданным по умолчанию предельным размером выдачи?Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам
Известно, что филогенетически самый далекий таксон это неклеточные организмы. Однако среди них "удовлетворительных" гомологов не нашлось. В BLAST был запрошен поиск гомологов изучаемого белка у всех клеточных организмов кроме Бактерий, как показано на рисунке 1. Наилучшие гомологи нашлись среди эукариотных организмов.
Рисунок 1. Три домена жизниПоиск по Swiss-Prot | Поиск по PDB | Поиск по "nr" | |
Номер находки в списке описаний | 1 | 1 | 4 |
Accession | P55296.1 | 3ZM8_A | BAL68133.1 |
E-value | 2e-17 | 1e-21 | 6e-26 |
Вес (в битах) | 86.3 | 95.1 | 114 |
% идентичности | 27% | 27% | 32% |
% сходства | 46% | 42% | 49% |
Длина выравнивания | 309 | 335 | 228 |
Координаты выравнивания (от-до, в запросе и в находке) | 4-290 в запросе; 120-395 в находке | 13-327 в запросе; 123-419 в находке | 55-268 в запросе; 30-244 в находке |
Число гэпов | 55 | 58 | 27 |
BLAST двух последовательностей
Сравнение последовательностей изучаемого белка MANB1_BACSU и его гомолога Q08480.1
Рисунок 2. Карту локального сходства двух последовательностей с порогом на E-value, равным 10 Рисунок 3. Карту локального сходства двух последовательностей с порогом на E-value, равным 0.011. Информация о банке "TrEMBL" на моей странице "http://kodomo.fbb.msu.ru/...