BLAST

Поиск гипотетических гомологов белка YOAJ_BACSU

Поиск гипотетических гомологов белка YOAJ_BACSU был выполнен с помощью BLAST в различных банках: "nr", Swiss-Prot и PDB. Банк "nr" (Non-redundant protein sequences) содержит информацию о белковых последовательностях из различных баз данных, банк Swiss-Prot содержит только аннотированные последовательности, а PDB только последовательности, для которых известна структура. Результат поиска представлен в таблице 1.

Таблица 1. Результаты поиска гипотетических гомологов белка YOAJ_BACSU

  Поиск по Swiss-Prot Поиск по PDB Поиск по "nr"

1. Лучшая находка (с последовательностью исходного белка)

Accession O34918.1 3D30_A NP_389744.1
E-value 2e-172 3e-153 9e-171
Вес (в битах) 481 428 481
Процент идентичности 100% 100% 100%

2. Число находок с E-value < 10–10

2 2 208

3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1)

Номер находки в списке описаний 11 3 396
Accession Q9M0C2.1 1LYQ_A XP_002267127.2
E-value 0.92 0.99 0.89
Вес (в битах) 32.7 29.3 38.9
% идентичности 43% 26% 25%
% сходства 51% 43% 41%
Длина выравнивания 37 104 259
Координаты выравнивания (от-до, в запросе и в находке) Запрос: 91-127
Находка: 85 - 121
Запрос: 54-143
Находка: 12 - 104
Запрос: 1-179
Находка: 12 - 207
Число гэпов 0 9 36

Исходный белок был найден во всех трех банках, в банке "nr" был достаточно большой кластер с полностью совпадающими последовательностями и нужный accession пришлось поискать. Число явных гомологов (e-value < 1e-10), найденных в банке "nr" значительно больше, чем в банках Swiss-Prot и PDB. Это можно объяснить тем, что неаннотированнных последовательностей гораздо больше, чем аннотированных и гомологов для данного белка среди них тоже больше. В банке "nr" был найден 501 гипотетический гомолог, в банке Swiss-Prot было 25 гипотетических гомологов, а в банке PDB - 16. Везде в качестве порога выступило значение e-value = 10. Наблюдается уменьшение числа "удачных" выравниваний в банках "nr", Swiss-Prot и PDB (по порядку). Это также происходит из-за описанных выше особенностей данных банков.

Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам

Поиск гипотетических гомологов белка в различных таксонах был сделан с помощью BLAST. Целью поиска было найти удовлетворительный гомолог (критерий: E-value < 0.001) нужного белка в наиболее "далеком" таксоне. В результате поиска в банках Swiss-Prot и "nr" такие гомологи были найдены в доминионе Eucariota у слизевика Dictyostelium discoideum (E-value = 4e-13) и у сумчатого гриба Colletotrichum gloeosporioides (E-value = 6e-24). В банке PDB не было найдено удовлетворительных гомологов. Таким образом, видна зависимость, описанная в предыдущем разделе: банках "nr", Swiss-Prot и PDB (по порядку) уменьшается количество "удачных" находок. Результаты поиска представлены в таблице 2.

Таблица 2. Результаты поиска гипотетических гомологов белка YOAJ_BACSU с фильтром по таксонам

  Поиск по Swiss-Prot Поиск по "nr"
Организм Eukaryota; Amoebozoa; Mycetozoa; Dictyosteliida; Dictyostelium discoideum Eukaryota; Fungi; Ascomycota; Glomerellaceae; Colletotrichum gloeosporioides Nara gc5
Accession Q55G31.1 ELA29560.1
E-value 4e-13 6e-24
Вес (в битах) 68.9 103
% идентичности 25% 38%
% сходства 42% 53%
Длина выравнивания 286 220
Координаты выравнивания (от-до, в запросе и в находке) Запрос: 5-232
Находка: 1 - 245
Запрос: 35-206
Находка: 27 - 201
Число гэпов 25 15

Парное выравнивание YOAJ_BACSU и его гипотетического гомолога ELA29560.1 с помощью BLAST

С помощью программы BLAST было выполнено парное выравнивание белка YOAJ из Bacillus subtilis и его гипотетического гомолога из эукариотического организма Colletotrichum gloeosporioides. В зависимости от установленного порогового значения e-value были получены два различных результата.


Рис.1. Карта локального сходства YOAJ_BACSU и его гипотетического гомолога ELA29560.1 (порог e-value = 10).

В случае, когда установлен порог e-value = 10, было получено три различных выравнивания, одно из них имеет e-value = 4e-31 (его характеристики описаны в таблице 2), а два других имеют e-value = 3.0 и 3.7 соответственно и длину 13 аминокислотных остатков каждое. На карте локального сходства (рисунок 1) можно увидеть три линии, две маленьких и одну большую, что сооветствует полученным выравниваниям.


Рис.2. Карта локального сходства YOAJ_BACSU и его гипотетического гомолога ELA29560.1 (порог e-value = 0.01).

В случае, когда установлен порог e-value = 0.01, количество участков сходства сокращается до одного, так как e-value маленьких участво сходства, полученных в прошлом выравнивании больше, чем 0.01. На карте локального сходства (рисунок 2) мы видим одну линию, полностью совпадающую с длинной линией из прошлого выравнивания.


© Анисимова Александра, 2013