Учебный сайт Софроновой Алины
PSI-BLAST

        PSI-BLAST - программа поиска семейств белков, даже если те находятся в отдаленном сродстве. Сначала PSI-BLAST в выбранной базе данных составляет множественное выравнивание для данного белка из последовательностей, баллы которых выше определенного порога. С каждой новой итерацией к найденным последовательностям добавляются новые. Таким образом, PSI-BLAST является средством для поиска семейств белков.
        Мне было предложено случайным образом выбрать один из 15 белков. Для этого в командную строку Python я ввела следующие команды:

import random
random.randint(1,15)

        В итоге выбор Python пал на число 12, а именно на белок с индентификатором Q3U7X3. Белок относится к домашней мыши (Mus musculus). основная его функция - связывание микротрубочек, поэтому неудивительно, если он будет встречатся у организмов разных групп.
        Поиск я проводила в базе данных RefSeq. Порог E-value для находок был по умолчанию 0.005. После 1 итерации было обнаружено 245 "хороших" находок и 26 "плохих". Данные белки содержат позвоночные из различных классов (чаще всего млекопитающие).
После 2 итерации количество последовательностей увеличилось до 247 (добавились 2 новые). После 3 итерации количество последовательностей не изменилось, поиск завершен. Порог между "худшей" находкой выше порога и "лучшей" находкой ниже порога очень велик (1e-07 - 0.052), что говорит о достоверности найденного семейства. Обобщающая информация по данным итерациям приведена в Таблице 1.

Таблица 1. Результаты трех последовательных итераций в PSI-BLAST

Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 245 XP_005139758.1 0.005 NP_001089746.1 0.009
2 247 NP_001129263.1 3e-05 WP_022706175.1 0.11
3 247 XP_005139758.1 1e-07 XP_006818559.1 0.052

        Далее используя уже знакомую программу Jalview я построила множественное выравнивание найденного семейства белков. Здесь вы можете ознакомится с fasta-файлом этих последовательностей. Результат выравнивания представлен на Рис.1.

Рис.1. Множественное выравнивание найденного семейства белков. Раскраска Clustalx. Консервативность более 70%.
Проект с данным выравниванием можно скачать здесь.


Вернуться к 2 семестру

© Алина Софронова, 2013
Дата последнего изменения: 28.11.2013