Поиск гипотетических гомологов изучаемого белка в разных банках
Таблица 1. Результаты поиска гипотетических гомологов белка XXXX_BACSU
Поиск по Swiss-Prot | Поиск по PDB | Поиск по "nr" | |
1. Лучшая находка (с последовательностью исходного белка) |
|||
Accession | P37528.1 | 2NV0_A | NP_387893.1 |
E-value | 6e-141 | 5e-142 | 3e-139 |
Вес (в битах) | 398 | 398 | 398 |
Процент идентичности | 100% | 100% | 100% |
2. Число находок с E-value < 10–10 |
201 | 9 | 1540 |
3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1) |
|||
Номер находки в списке описаний | 467 | 19 | 3045 |
Accession | B9L0W3.1 | 4GUD_A | ZP_09786609.1 |
E-value | 0.94 | 0.80 | 0.99 |
Вес (в битах) | 33.5 | 30 | 38.1 |
% идентичности | 25% | 25% | 32% |
% сходства | 68% | 85% | 37% |
Длина выравнивания | 527 | 211 | 226 |
Координаты выравнивания (от-до, в запросе и в находке) | запрос: 41-174 находка: 64-186 |
запрос: 19-186 находка: 21-203 |
запрос:15-87 находка:19-94 |
Число гэпов | 27 | 35 | 13 |
Мне удалось найти свой белок pdxt_bacsu в базах данных SwissProt и nr, а его структуру в PDB.
Число гомологов для разных баз данных подчиняется следующему правилу: nr < SwissProt < PDB ; поскольку nr включает множество баз и не все белки, описанные в nr, имеют качественное описание в SwissProt, а трехмерные структуры PDB имеются у еще меньшего числа. Во всех трех базах последняя находка соответствует "худшей из удовлетворительных", поскольку в каждом случае число находок было лимитировано пороговым значением E-value.
Поиск гипотетических гомологов белка с фильтром по таксонам
3. Результат поиска гипотетического гомолога белка pdxt_bacsu в базе данных SwissProt (первый в выдаче с E-value < 0,001 принадлежащий самому отдаленному от B.subtilis таксону) |
|||
Таксон | Eukaryota | ||
Номер находки в списке описаний | 1 | ||
Accession | Q8LAD0.1 | ||
E-value | 3e-52 | ||
Вес (в битах) | 161 | ||
% идентичности | 41% | ||
% сходства | 98% | ||
Длина выравнивания | 255 | ||
Координаты выравнивания (от-до, в запросе и в находке) | запрос: 2-194 находка: 1-226 |
||
Число гэпов | 33 |
BLAST двух последовательностей
Ниже приведены карты локального сходства для парного выравнивания белка pdxt_bacsu и его гомолога из Eukaryota pdx2_arath при E-value равном 0,001 и 10.