Главная | Семестры | Проекты | Заметки | О себе | Полезные ссылки |
Поиск семейств белков с помощью PSI-BLAST
PSI-BLAST - программа для нахождения отдаленных гомологов. Она использует технику профилей (Position-specific scoring matrix, PSSM), которые строятся на основе уже найденных гомологов. Для проведения поиска необходимо провести несколько итераций для получения сходящегося результата. В качестве объекта исследования используем белок с идентификатором Q1AHR3. Проведем последовательные итерации, используя данный алгоритм. При этом будем руководствоваться следующими принципами:
1)Не включать в следующую итерацию находки со значительно отличающимся значением E-value;
2)Не включать таксономически резко отличающиеся находки;
3)Обращать внимание на качество выравнивания.
Ниже приведена таблица, описывающая выполненные итерации:
Номер итерации | Число находок выше порога (0,005) | Идентификатор худшей находки выше порога | E-value этой находки | Идентификатор лучшей находки ниже порога | E-value этой находки |
1 | 19 | EDL06083.1 | 2e-07 | ELK04105. | 0.29 |
2 | 20 | ELK04105.1 | 1e-10 | YP_005335608.1 | 0.01 |
3 | 20 | ELK04105.1 | 3e-10 | XP_004473155.1 | 0.006 |
4 | 20 | EDL06083.1 | 3e-15 | EMP23674.1 | 0.005 |
5 | 20 | EDL06083.1 | 3e-15 | EMP23674.1 | 0.005 |
Проверим, действительно ли полученная выборка представляет собой гомологичные белки. Для этого построим выравнивание. (Рис.1) В выравнивании хорошо заметны блоки во всех последовательностях из выборки. Соответственно, мы можем сделать вывод, что это действительно гомологи.
Рис.1 Выравнивание последовательностей-гомологов белка Q1AHR3, найденных с помощью PSI-BLAST. Выравнивание выполнено с помощью редактора JalView, программа Muscle.
Сравним выравнивание семейства домена, имеющегося в данной последовательности, с полученным выравниванием. Произведем поиск по PFAM, обнаружим домен: Bclt. Он встречается в эукариотах, в Bcl-2-подобных белках, участвующих в апоптозе. На рис.2 представлено выравнивание последовательностей, содержащих этот домен. Здесь мы также может видеть те же блоки, что и для предыдущего выравнивания, что говорит нам о том, что гомологи были выбраны правильно. На рис.3 представлена таксономия этих белков. Здесь мы заметим, что в обоих выравниваниях участвуют практически те же таксономические группы белков.
Cреди последовательностей, найденных с помощью PSI-BLAST, есть последовательность с идентификатором в GeneBank - ELK04105.1, содержащая 2 домена: общий для всех последовательностей - Bclt и ASFV_J13L.(семья, включающая вирусные белки свиной африканской лихорадки). Также есть последовательность с идентификатором EGW02743.1 в GeneBank, имеющая лишь часть основного домена Bclt, и еще один домен - Actin.
Рис.2 Выравнивание последовательностей-гомологов белка Q1AHR3, найденных с помощью PFAM. Выравнивание выполнено с помощью редактора JalView, программа Muscle.
Рис.3 Таксономия гомологов белка Q1AHR3, найденных с помощью PFAM.