PSI-BLAST
Поиск гомологов белка LGB1_LUPLU (P02239) в базе данных SwissProt посредством программы BlastP.Параметры программы BlastP:
1) Учёт особенностей аминокислотного состава (Compositional adjustments): "No adjustment";
2) Фильтрование областей низкой сложности: "Low complexity";
3) Максимальное значение E-value: 10;
4) Максимальное количество находок (Number of Descriptions ): 1000;
5) Банк данных: SwissProt.
Результаты поиска:
Таблица 1. Поиск гомологов белка LGB1_LUPLU (P02239) в БД SwissProt
Кол-во | E-value лучшей находки | Название лучшей находки (ID) | % идентичности | Длина выравнивания | |
Всего находок | 117 | 5e-82 | LGB1_LUPLU | 100% | 154 |
В бактериях (Bacteria) | 36 | 1e-06 | HMP_RHIME | 29% | 117 |
В Escherichia coli K-12 | 0 | ||||
В животных (Metazoa) | 26 | 2e-06 | NGB_BRARE | 25% | 141 |
В человеке | 3 | 5.8 | CRNL1_HUMAN | 28% | 78 |
Среди белков человека и кишечной палочки гомологов обнаружено не было.
Поиск гомологов белка LGB1_LUPLU (P02239) в базе данных SwissProt посредством программы PSI-BLAST.
Параметры программы PSI-BLAST:
1) Учёт особенностей аминокислотного состава (Compositional adjustments): "No adjustment";
2) Фильтрование областей низкой сложности: "Low complexity";
3) Максимальное значение E-value: 10; Пороговое значение E-value: 0.005;
4) Максимальное количество находок (Number of Descriptions ): 1000;
5) Банк данных: SwissProt.
Результаты поиска:
Таблица 2. Итерационный поиск гомологов LGB1_LUPLU (P02239) в БД SwissProt с
помощью программы PSI-BLAST
Номер итерации
|
Бактерии
|
Животные
|
Характеристика лучшей находки среди белков
|
|||||||||
Escherichia coli, K-12
|
Homo sapiens sapiens
|
|||||||||||
Кол-во
|
Новые
|
Кол-во
|
Новые
|
Название
|
E-value
|
% идентичности
|
Длина выравнивания
|
Название
|
E-value
|
% идентичности
|
Длина выравнивания
|
|
1
|
21 | + | 5 | + | - | - | - | - | CRNL1_HUMAN | 5.8 | 28% | 78 |
2
|
38 | + | 332 | + | HMP_ECOLI | 1е-29 | 20% | 148 | NGB_HUMAN | 2е-19 | 21% | 143 |
3
|
38 | - | 879 | + | HMP_ECOLI | 6е-28 | 20% | 148 | HGB2_HUMAN | 8е-45 | 18% | 150 |
4
|
38 | - | 884 | + | HMP_ECOLI | 2е-22 | 20% | 143 | HBE_HUMAN | 5е-54 | 17% |
154 |
5
|
38 | - | 884 | - | HMP_ECOLI | 2е-22 | 19% | 143 | HBE_HUMAN | 7е-54 | 17% |
154 |
1. Программа PSI-BLAST используется для поиска далёких друг от друга гомологов белков среди всех царств живых организмов.
2. Первая итерация поиска PSI-BLAST представляет собой поиск посредством программы BlastP, при условии одинаковых параметров поиска.
3. В результате упражнения №2 были найдены гомологи белка LGB1_LUPLU (P02239) (Leghemoglobin-1 организма Lupinus luteus (European yellow lupin)), причём встречающиеся как у человека, так и у кишечной палочки.
4. В продолжение поиска для кишечной палочки E-value
увеличивается, а процент идентичности и длина выравнивания последовательностей
уменьшаются, для человека же, значение E-value
уменьшается, хотя при последней итерации это значение несколько увеличилось,
процент идентичности уменьшается и длина выравнивания белковых
последовательностей увеличивается.
Для каждого последующего поиска программа PSI-BLAST создаёт новых профиль PSSM, учитывая белки, найденные в предыдущей итерации поиска. Значение E-value для белка из организма Escherichia coli увеличивалось. Это объясняется тем, что в дальнейший итерациях количество белков в результате поиска оставалось одинаковым и равным 38, при этом профиль PSSM становился менее строгим.
Для белка - лучшей находки из организма Homo sapiens sapiens значение E-value в первых четырёх итерациях уменьшалось за счёт того, что профиль PSSM также становился менее строгим, а количество находок увеличивалось. Незначительное уменьшение значения E-value на пятой итерации поиска объясняется тем, что, как и в случае поиска среди белков Escherichia coli, количество находок увеличилось несильно, а профиль PSSM стал учитывать большее количество белков.
5. Если при каждой итерации вести поиск по всем огранизмам, то программа PSI-BLAST будет создавать профиль PSSM, учитывая белки всех таксонов. Если после каждой итерации отфильтровывать найденные белки по интересующему таксону, то профиль PSSM будет создаваться на основе всё более схожих белковых последовательностей и результатом поиска всё чаще будут оказываться гомологи исследуемого белка из этого таксона.
На главную страницу второго семестра