PSI-BLAST

Главная Семестры Проекты Заметки О себе Полезные ссылки


Поиск семейств белков с помощью PSI-BLAST

PSI-BLAST - программа для нахождения отдаленных гомологов. Она использует технику профилей (Position-specific scoring matrix, PSSM), которые строятся на основе уже найденных гомологов. Для проведения поиска необходимо провести несколько итераций для получения сходящегося результата. В качестве объекта исследования используем белок с идентификатором Q1AHR3. Проведем последовательные итерации, используя данный алгоритм. При этом будем руководствоваться следующими принципами:
1)Не включать в следующую итерацию находки со значительно отличающимся значением E-value;
2)Не включать таксономически резко отличающиеся находки;
3)Обращать внимание на качество выравнивания.

Ниже приведена таблица, описывающая выполненные итерации:

Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 19 EDL06083.1 2e-07 ELK04105. 0.29
2 20 ELK04105.1 1e-10 YP_005335608.1 0.01
3 20 ELK04105.1 3e-10 XP_004473155.1 0.006
4 20 EDL06083.1 3e-15 EMP23674.1 0.005
5 20 EDL06083.1 3e-15 EMP23674.1 0.005


Проверим, действительно ли полученная выборка представляет собой гомологичные белки. Для этого построим выравнивание. (Рис.1) В выравнивании хорошо заметны блоки во всех последовательностях из выборки. Соответственно, мы можем сделать вывод, что это действительно гомологи.



Рис.1 Выравнивание последовательностей-гомологов белка Q1AHR3, найденных с помощью PSI-BLAST. Выравнивание выполнено с помощью редактора JalView, программа Muscle.

Сравним выравнивание семейства домена, имеющегося в данной последовательности, с полученным выравниванием. Произведем поиск по PFAM, обнаружим домен: Bclt. Он встречается в эукариотах, в Bcl-2-подобных белках, участвующих в апоптозе. На рис.2 представлено выравнивание последовательностей, содержащих этот домен. Здесь мы также может видеть те же блоки, что и для предыдущего выравнивания, что говорит нам о том, что гомологи были выбраны правильно. На рис.3 представлена таксономия этих белков. Здесь мы заметим, что в обоих выравниваниях участвуют практически те же таксономические группы белков.

Cреди последовательностей, найденных с помощью PSI-BLAST, есть последовательность с идентификатором в GeneBank - ELK04105.1, содержащая 2 домена: общий для всех последовательностей - Bclt и ASFV_J13L.(семья, включающая вирусные белки свиной африканской лихорадки). Также есть последовательность с идентификатором EGW02743.1 в GeneBank, имеющая лишь часть основного домена Bclt, и еще один домен - Actin.



Рис.2 Выравнивание последовательностей-гомологов белка Q1AHR3, найденных с помощью PFAM. Выравнивание выполнено с помощью редактора JalView, программа Muscle.



Рис.3 Таксономия гомологов белка Q1AHR3, найденных с помощью PFAM.