BLAST




Таблица 1. Результаты поиска гипотетических гомологов белка THIE_BACSU в разных банках

  Поиск по Swiss-Prot Поиск по PDB Поиск по "nr"

1. Лучшая находка (с последовательностью исходного белка)

Accession P39594 3O15_A NP_391708
E-value 6e-160 8e-161 3e-158
Вес (в битах) 448 448 448
Процент идентичности 100% 100% 100%

2. Число находок с E-value < 10–10

300 12 4238

3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1)

Номер находки в списке описаний 367 25 5190
Accession B9DKX7 2YZR_A ZP_00957345
E-value 0,92 0,81 0,99
Вес (в битах) 33,5 30,8 38,1
% идентичности 39% 37% 25%
% сходства 59% 57% 47%
Длина выравнивания 54 54 107
Координаты выравнивания (от-до, в запросе и в находке) 168-218; 206-259 168-218; 241-294 71-177; 52-153
Число гэпов 3 3 5

Удалось ли найти исходный белок в Swiss-Prot и "nr", а его структуру в PDB?

Да, удалось.

Cравните число явных гомологов (E-value < 1e-10) при поиске по разным БД и поясните возможные причины различий.

SwissProt:300
PDB:12
"nr":4238
Количество находок "nr" по сравнению с находками в 2-х других банках очень велико, это связано с тем, что данный банк включает в себя последовательности из всевозможных источников, в том числе и непроверенные. Причины разницы в количестве находок при поиске в SwissProt и PDB, возможно, случайна, и зависит просто от самой последовательности. Стоит еще отметить интересную разницу в E-value находок под номерами 300 и 301 при поиске в SwissProt, они равны 5е-11 и 0,002(достаточно серьезное различие), соответственно, чего мы не наблюдаем при поиске в PDB.

Сколько всего находок и каков E-value самой последней находки? Чем в вашем случае было лимитировано число находок: значением E-value или заданным по умолчанию предельным размером выдачи?

SwissProt:513; E-value:9,7
PDB:46; E-value:9,4
"nr":5545; E-value:10,0
Абсолютно все запросы я проводила с максимальным параметром поля "Max target sequences", равным 20000, поэтому число находок у меня всегда лимитировано значением E-value.

Поиск гипотетических гомологов изучаемого белка THIE_BACSU с фильтром по таксонам

Гомолог найден в царстве Eukaryota. Его полное название: Thiamine biosynthetic bifunctional enzyme TH1, chloroplastic.

Таблица 2. Описание результата поиска.

Номер находки в списке описаний 1
Accession Q5M731
E-value 1e-34
Вес(в битах) 123
% идентичности 38%
% сходства 57%
Длина выравнивания 200
Координаты выравнивания (от-до, в запросе и в находке) 29-221; 330-521
Число гэпов 15

BLAST двух последовательностей

Plot of gi|732341|sp|P39594.1|THIE_BACSU vs gi|75222969|sp|Q5M731.1|TPS1L_ARATH

Рис 1. Карта локального сходства с порогом на E-value, равному 10 (т.е. по умолчанию).
Рис 2. Карта локального сходства с порогом на E-value, равному 0,01.


© Novikova Maria, 2013
Последнее обновление: 02.03.2013