1. Поиск гипотетических гомологов изучаемого белка в разных банках

Результаты поиска гипотетических гомологов белка RIDA_BACSU


Поиск по Swiss-Prot Поиск по PDB Поиск по "nr"

1. Лучшая находка

Accession P37552 1QD9 NP 387929 (hypothetical protein BSU00480), сам белок на 4м месте
E-value 5e-88 3e-88 2e-86 (результат самого белка - 1e-85)
Вес (в битах) 258 256 258
Процент идентичности 100% 100% 100%

2. Сколько хороших кандидатов в гомологи найдено?

67 28 3661

3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1)

Номер находки в списке описаний 74 32 6626
Accession A9BDY5 3LME ZP 09799019
E-value 0.55 0.006 0.99
Вес (в битах) 32.7 34.7 35.8
% идентичности 23% 30% 34%
% сходства 40% 56% 47%
Длина выравнивания 88 87 105
Координаты выравнивания (от-до, в запросе и в находке) 21-104; 187-264 38-119; 41-123 30-125; 32-136
Число гэпов 14 9 9


Комментарии к результатам поиска:



2. Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам.


Гомологи моему белку обнаружились сразу же, при поиске среду эукариот. Для сравнения я взяла белок с наименьшим e-value, им оказался MMF1_YEAST из митохондрий (вот, отсылка к прокариотам) дрожжей Saccharomyces cerevisiae S288c.

Номер находки в списке описаний 1
Accession P40185
E-value 3e-42
Вес (в битах) 132
% идентичности 53%
% сходства 67%
Длина выравнивания 121
Координаты выравнивания (от-до, в запросе и в находке) 5 - 125; 24 - 144
Число гэпов 0

3. Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.


Записав последовательности белков RIDA_BACSU и MMF1_YEAST в отдельные файлы, с помощью команд stretcher rida_bacsu mmf1_yeast -gapopen 11 -gapextend 1 и matcher rida_bacsu mmf1_yeast -gapopen 11 -gapextend 1 я записала полное и частичное выравнивания в два отдельных файла, использовав при этом параметры BLAST-а. Итого, имеем три файла с тремя выравниваниями:



Для начала сравним формальные характеристики выравниваний:

ВыравниваниеScoreLength% Identities% PositivesGaps
BLAST33112153%67%0
stretcher28314565%82%20
matcher32112152.9%66.9%0

Сразу же очевидно, что выравнивания BLAST и matcher абсолютно одинаковы. Их вес немного разный при совершенно идентичных штрафах за гэпы (хотя их нет) и матрице, что, видимо, является опять-таки следствием сложных алгоритмов BLAST (они действительно странные и выдают неожиданный результат даже на очень простых выравниваниях). Так же очевидно, что выравнивание stretcher, как единственное полное, имеет меньший вес, так как учитывает вставочную мутацию 2-20 по второй последовательности и гэп, соответствующий последнему 145му остатку второго белка, и начисляет за нее штрафы. Процент согласованности столбцов для matcher, соответственно, 100%; для stretcher 20/145 *100% = 86,2%.