Лого сайта
PSI-BLAST

1. Составление семейства гомологов белка при использовании сервиса PSI-BLAST

Для выполнения этого практикума был выбран белок с AC:Q3SXS7. После этого был проведен запуск PSI-BLAST на n интерациях при поиске по базе refseq при стандартных настройках, отбор для каждой интерации щел как по e-value так и по покрытию.
Протокол проведения интераций представлен в Таблице 1.

Таблица 1. Протокол проведения многоинтерационного запуска сервиса PSI-BLAST для белка Q3SXS7.

Номер итерации Число находок выше порога (1e-7) приемлемых для следующей интерации Идентификатор худшей находки выше порога взятой для следующей интерации E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 27 XP_001154286.1 6e-10 XP_003905674.1 3e-07
2 31 XP_004484190.1 4e-09 XP_002192624.2 2e-07
3 31 XP_004484190.1 2e-08 XP_002192624.2 8e-05

Поиск при помощи PSI-BLAST'а стабилизировался после 3-х интераций на 31 находке. После этого с 31-ой белковой последовательностью было проведено множественное выравнивание при помощи сервиса T-coffee и скачано для обработки.

Иллюстрация 1. Множественное выравнивание белков, возможно сходных с белком Q3SXS7. Схема раскраски Clustalx, по 30% сходству.

Сравнение выравнивания семейства домена, имеющегося в последовательности белка Q3SXS7, с полученным множественным выравниванием.

В белке Q3SXS7 представлен домен BaffR-Tall_bind. Этому домену принадлежит 31 (!) белковая последовательность. На Иллюстрации 2 представлены выравнивания 31 последовательности, принадлежащие этому домену по данным Pfam.

Иллюстрация 2. Множественное выравнивание белков, приндалежащих домену BaffR-Tall_bind. Схема раскраски Clustalx, по 30% сходству.

Как видно из Иллюстрации 2, данные участки выравнивания явно встречаются и на иллюстрации 1. Однако не все белки из 31 совпадают в обоих случаях, онако при этом домен BaffR-Tall_bind встречается во всех из них, по результатам множественного выравнивания всех 31*2=62 последовательностей (некоторые повторяютя, но не все). Результаты этого выравнивания представлены на Иллюстрации 3.

Иллюстрация 3. Множественное выравнивание белков, приндалежащих домену BaffR-Tall_bind и найденного семейства белков. Схема раскраски Clustalx, по 30% сходству.

Как явно видно из Иллюстрации 3. у всех белков (кроме 1 : gi|397487222|ref|XP_003814704.1|PREDICTED: uncharacterized protein LOC100968929 [Pan paniscus]) присутствует мотив домена BaffR-Tall_bind представленный на Иллюстрации 2., что говорит от том, что все фигурирующие белки принадлежат к одному семейству, содержащему в себе домен BaffR-Tall_bind.