Поиск гипотетических гомологов белка YOAJ_BACSU
Поиск гипотетических гомологов белка YOAJ_BACSU был выполнен с помощью BLAST в различных банках: "nr", Swiss-Prot и PDB. Банк "nr" (Non-redundant protein sequences) содержит информацию о белковых последовательностях из различных баз данных, банк Swiss-Prot содержит только аннотированные последовательности, а PDB только последовательности, для которых известна структура. Результат поиска представлен в таблице 1.
Таблица 1. Результаты поиска гипотетических гомологов белка YOAJ_BACSU
Поиск по Swiss-Prot | Поиск по PDB | Поиск по "nr" | |
1. Лучшая находка (с последовательностью исходного белка) |
|||
Accession | O34918.1 | 3D30_A | NP_389744.1 |
E-value | 2e-172 | 3e-153 | 9e-171 |
Вес (в битах) | 481 | 428 | 481 |
Процент идентичности | 100% | 100% | 100% |
2. Число находок с E-value < 10–10 |
2 | 2 | 208 |
3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1) |
|||
Номер находки в списке описаний | 11 | 3 | 396 |
Accession | Q9M0C2.1 | 1LYQ_A | XP_002267127.2 |
E-value | 0.92 | 0.99 | 0.89 |
Вес (в битах) | 32.7 | 29.3 | 38.9 |
% идентичности | 43% | 26% | 25% |
% сходства | 51% | 43% | 41% |
Длина выравнивания | 37 | 104 | 259 |
Координаты выравнивания (от-до, в запросе и в находке) | Запрос: 91-127 Находка: 85 - 121 |
Запрос: 54-143 Находка: 12 - 104 |
Запрос: 1-179 Находка: 12 - 207 |
Число гэпов | 0 | 9 | 36 |
Исходный белок был найден во всех трех банках, в банке "nr" был достаточно большой кластер с полностью совпадающими последовательностями и нужный accession пришлось поискать. Число явных гомологов (e-value < 1e-10), найденных в банке "nr" значительно больше, чем в банках Swiss-Prot и PDB. Это можно объяснить тем, что неаннотированнных последовательностей гораздо больше, чем аннотированных и гомологов для данного белка среди них тоже больше. В банке "nr" был найден 501 гипотетический гомолог, в банке Swiss-Prot было 25 гипотетических гомологов, а в банке PDB - 16. Везде в качестве порога выступило значение e-value = 10. Наблюдается уменьшение числа "удачных" выравниваний в банках "nr", Swiss-Prot и PDB (по порядку). Это также происходит из-за описанных выше особенностей данных банков.
Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам
Поиск гипотетических гомологов белка в различных таксонах был сделан с помощью BLAST. Целью поиска было найти удовлетворительный гомолог (критерий: E-value < 0.001) нужного белка в наиболее "далеком" таксоне. В результате поиска в банках Swiss-Prot и "nr" такие гомологи были найдены в доминионе Eucariota у слизевика Dictyostelium discoideum (E-value = 4e-13) и у сумчатого гриба Colletotrichum gloeosporioides (E-value = 6e-24). В банке PDB не было найдено удовлетворительных гомологов. Таким образом, видна зависимость, описанная в предыдущем разделе: банках "nr", Swiss-Prot и PDB (по порядку) уменьшается количество "удачных" находок. Результаты поиска представлены в таблице 2.
Таблица 2. Результаты поиска гипотетических гомологов белка YOAJ_BACSU с фильтром по таксонам
Поиск по Swiss-Prot | Поиск по "nr" | |
Организм | Eukaryota; Amoebozoa; Mycetozoa; Dictyosteliida; Dictyostelium discoideum | Eukaryota; Fungi; Ascomycota; Glomerellaceae; Colletotrichum gloeosporioides Nara gc5 |
Accession | Q55G31.1 | ELA29560.1 |
E-value | 4e-13 | 6e-24 |
Вес (в битах) | 68.9 | 103 |
% идентичности | 25% | 38% |
% сходства | 42% | 53% |
Длина выравнивания | 286 | 220 |
Координаты выравнивания (от-до, в запросе и в находке) | Запрос: 5-232 Находка: 1 - 245 |
Запрос: 35-206 Находка: 27 - 201 |
Число гэпов | 25 | 15 |
Парное выравнивание YOAJ_BACSU и его гипотетического гомолога ELA29560.1 с помощью BLAST
С помощью программы BLAST было выполнено парное выравнивание белка YOAJ из Bacillus subtilis и его гипотетического гомолога из эукариотического организма Colletotrichum gloeosporioides. В зависимости от установленного порогового значения e-value были получены два различных результата.
Рис.1. Карта локального сходства YOAJ_BACSU и его гипотетического гомолога ELA29560.1 (порог e-value = 10).
В случае, когда установлен порог e-value = 10, было получено три различных выравнивания, одно из них имеет e-value = 4e-31 (его характеристики описаны в таблице 2), а два других имеют e-value = 3.0 и 3.7 соответственно и длину 13 аминокислотных остатков каждое. На карте локального сходства (рисунок 1) можно увидеть три линии, две маленьких и одну большую, что сооветствует полученным выравниваниям.
Рис.2. Карта локального сходства YOAJ_BACSU и его гипотетического гомолога ELA29560.1 (порог e-value = 0.01).
В случае, когда установлен порог e-value = 0.01, количество участков сходства сокращается до одного, так как e-value маленьких участво сходства, полученных в прошлом выравнивании больше, чем 0.01. На карте локального сходства (рисунок 2) мы видим одну линию, полностью совпадающую с длинной линией из прошлого выравнивания.