Blast



1. Поиск гипотетических гомологов изучаемого белка в разных банках

Таблица 1. Результаты поиска гипотетических гомологов белка YPWA_BACSU
  Поиск по Swiss-Prot Поиск по PDB Поиск по "nr"

1. Лучшая находка (с последовательностью исходного белка)

Accession P50848.1 3HQ2_A YP_006630410.1
E-value 0.0 0.0 0.0
Вес (в битах) 1031 1031 1032
Процент идентичности 100% 100% 100%

2. Число находок с E-value < 10–10

2 5 1424

3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1)

Номер находки в списке описаний 3 6 1457
Accession Q6ECI6.1 2J37_W YP_005406125.1
E-value 0.56 0.33 0.23
Вес (в битах) 83 75 93
% идентичности 24 28 32
% сходства 40 38 55
Длина выравнивания 132 121 63
Координаты выравнивания (от-до, в запросе и в находке) запрос: 57-180
находка: 327-451
запрос: 68-183
находка: 43-158
запрос: 17-79
находка: 15-77
Число гэпов 14 10 0
  1. Поиск искомого белка во всех трех базах данных увенчался успехом, была найдена и 3D структура.
  2. Бросается в глаза явное отличие количества находок потенциальных гомологов в разных базах. Это связано, в первую очередь, с их размерами. Так, например, БД NR является совокупностью нескольких баз данных (все последовательности, полученные из автоматической трансляции GenBank CDS+PDB+SwissProt+PIR+PRF без проб из окружающей среды проекта WGS)
  3. Число находок для каждого варианта поиска было различным. Однако наблюдалась следующая очевидная закономерность БД PDB содержала меньше всего находок (8: e-value последней 5,7), БД SwissProt больше (14: e-value последней 8,7), и. наконец, наибольшее количество находок преподнесла БД NR, причем для нее число находок было лимитировано не значением E-value, а количеством находок, заданным для выдачи по умолчанию ( e-value)

2. Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам

В этом задании я использовала БД NR (так как в задании не было уточнений). Результаты представлены в таблице 1.

Табл. 2. Результаты поиска с фильтром по таксонам


Нетрудно заметить, что качество выравнивания увеличивается по мере сужения запроса и приближения к виду, который близок к организму с белком. Видимо, эта металлопротеаза довольно видоспецифична, поэтому, несмотря на все сужающийся ранг таксонов, и, соответственно, их объем, приближение к близкому организму все же увеличивает качество выравнивания.
Первый результат с e-value, равным нулю, бы получен в классе Clostridia. Первый удовлетворительный результат - уже у Эукариот.

3. BLAST двух последовательностей

Разные значения порогов, задаваемые при локальном выравнивании двух последовательностей, никак не повлияли на выравнивание (см. рис. 1 и 2). Вероятно, это связано с очень низким порядком E-value находки (-110).

Рис.1. Карта локального сходства белков YPWA_BACSU
и XP_002505717.1 с порогом E-value 10
Рис.2. Карта локального сходства белков YPWA_BACSU
и XP_002505717.1 с порогом E-value 0,01

© Elizaveta Besedina, FBB 2012
lizaveta@kodomo.fbb.msu.ru