PSI-BLAST
Поиск гомологов белка LGB1_LUPLU (P02239) в БД SwissProt с помощью программы blastp.
Начальные параметры поиска в программе blastp:
Кол-во | E-value лучшей находки | Название лучшей находки (ID) | % идентичности | Длина выравнивания | |
Всего находок | 117 | 5*10–82 | LGB1_LUPLU | 100% | 154 |
В бактериях (Bacteria) | 36 | 1*10–06 | HMP_RHIME | 29% | 117 |
В Escherichia coli K-12 | 0 | - | - | - | - |
В животных (Metazoa) | 26 | 2*10–06 | NGB_BRARE | 25% | 141 |
В человеке | 3 | 5,8 | CRNL1_HUMAN | 28% | 78 |
В результатах поиска гомологов белка LGB1_LUPLU удалось обнаружить гомологи из белков
человека (12 гомологов), однако гомологов из белков Escherichia coli не оказалось.
Поиск гомологов белка LGB1_LUPLU (P02239) в БД SwissProt с помощью программы PSI-BLAST.
Начальные параметры поиска в программе PSI-BLAST:
Номер итерации |
Бактерии
|
Животные
|
Характеристика лучшей находки среди белков | |||||||||
Escherichia coli, K-12 |
Homo sapiens sapiens | |||||||||||
Кол-во |
Новые |
Кол-во |
Новые |
Название |
E-value |
% идентичности |
Длина выравнивания |
Название |
E-value |
% идентичности |
Длина выравнивания | |
1 |
21 | + | 5 | + | — | — | — | — | CRNL1_HUMAN | 5.8 | 28% | 78 |
2 |
38 | + | 332 | + | HMP_ECOLI | 1e-29 | 20% | 148 | NGB_HUMAN | 2e-19 | 21% | 143 |
3 |
38 | - | 879 | + | HMP_ECOLI | 6e-28 | 20% | 148 | HBG2_HUMAN | 8e-45 | 18% | 150 |
4 |
38 | - | 884 | + | HMP_ECOLI | 2e-22 | 20% | 143 | HBE_HUMAN | 5e-54 | 17% | 154 |
5 |
38 | - | 884 | - | HMP_ECOLI | 2e-22 | 20% | 143 | HBE_HUMAN | 5e-54 | 17% | 154 |
Белок LGB1_LUPLU является белком из организма Lupinus luteus, который относится к царству растений, Plantae. С помощью программы PSI-BLAST были найдены гомологи этого белка из организмов, эволюционно очень далёких от Lupinus luteus, таких как кишечная палочка и человек (расхождение их идёт на уровне царств, что позволяет вообще пренебречь каким-либо родством между этими организмами), тогда как программа blastp не справилась с подобной задачей. Поэтому логично предположить, что PSI-BLAST является удобным инструментом для поисками далёких гомологов из неродственных или с очень низким коэффициентом родства организмов.
Из данных таблицы нетрудно заметить, что при начальных параметрах, идентичных в обоих случаях двух программ, PSI-BLAST и blastp срабатывают аналогично друг другу. Поэтому первая итерация PSI-BLAST есть ни что иное, как поиск по тем же параметрам с помощью PSI-BLAST.
В итоге, после второго поиска по PSI-BLAST мы нашли множество далёких гомологов для белка PSI-BLAST из Lupinus luteus. Все эти белки объединяются некими общностями на уровне последовательностей, значит, существуют некие специфичные сайты, объединяющие эти белки на функциональном уровне. Действительно, все эти белки переносят кислород.
По мере прохождения каждой новой итерации с "лучшими находками" происходят следующие изменения: изменяется Е-value, процент идентичности и длина выравнивания для "лучшей находки". Что касается общего механизма поиска: Для лучших находок генерируются множественное выравнивание. Строятся матрица PSSM - матрица, отражающая проценты встречаемости аминокислотных остатков в последовательностях. Затем по этой матрице база данных ищет белки, наиболее близкие по процентам встречаемости аминокислотных остатков. Это и есть лучшие находки. После каждой итерации происходит то же самое - строится множественное выравнивание, матрица PSSM, проводится поиск, до тех пор, пока не найдены все белки, удовлетворяющие матрице PSSM. Когда это происходит, программа перестаёт выдавать новые находки.