Учебный сайт Мухалевой Лизаветы

BLAST

Поиск гомологов

       Выравнивания, которые мы разбирали на предыдущих практикумах, используются для определения гомологии белков - на их основе сделаны программы BLAST (Basic Local Alignment Search Tool). Принцип работы таких программ заключается в следующем: на вход предоставляется последовательность, алгоритм сравнивает её с последовательностями в базе данных и оценивает сходство.

       Для этого практикума я пользовалась данной программой. Белок, для которого я искала гомологи, всё тот же - Zn-зависимая пептидаза семейства M48 из бактерии Geobacter sulfurreducens PCA. Поиск осуществлялся в базе данных Uniprot/SwissProt. На выходе BLAST выдаёт таблицу со следующими колонками: Description - имя белкя, Max score - максимальный вес выравнивания, Total score - общий вес выравнивания, Query cover - процент перекрытия данной последовательности и белка-гомолога, E-value - ожидаемое количество случайных находок с таким же и лучшим Score (в той же базе данных, с теми же параметрами), Ident - процент индентичности данной последовательности и белка-гомолога, Accession - индентификатор белка-гомолога. В результате было найдено 32 последовательности с различными параметрами гомологичности, из которых я выбрала последовательность белка протеаза, ускоряющая сборку β-бочки, из организма Salmonella enterica subsp. enterica serovar Typhi. Параметры выравнивания этих последовательностей представлены в таблице 1.

Таблица 1. Параметры выравнивания выбранного гомолога.

Description Max score Total score Query cover E-value Ident Accession
TPR repeat-containing protein YfgC; Flags: Precursor 127 127 81% 2e-32 33% P66951.1

       На рисунке 1 представлено выравнивание, показываемое в программе BLAST. Вес находки (Score) - 319, число совпадений (Identities) - 74 (33%), число "сходных" букв (Positives) - 126 (56%), число гэпов (Gaps) - 12 (5%).

Рисунок 1. Выравнивание входного белка пептидаза M48 и протеазы.

Построение карты локального сходства

       Далее я получила карту локального сходства с помощью функции выравнивания двух последовательностей. Осями координат являются координаты последовательностей: ось абсцисс - белок протеазы, ось ординат - белок пептидазы. Сама карта представлена на рисунке 2.

Рисунок 2. Карта локального сходства белка пептидаза M48 и протеазы.

       По карте видно, что последовательности совпадают не сразу, а точнее со 33 аминокислоты. Далее идут прерывающиеся участки гомологичности - возможно, в этих местах произошли случайные мутации. Далее, с 157 по 161 аминокислоты в последовательности пептидазы идёт участок гэпов - видимо, в этом месте произошла делеция. Также гэпы имеются на позициях №138, №166, №178 и №221 - также возможна делеция (либо вставка в гомологичной последовательности). В последовательности гомолога тоже имеется небольшой разрыв - позиции №№ 231-232. На карте имеются два участка (позиции №№152-190 и №№228-242), смещённые относительно основного графика по вертикали. Если посмотреть на выравнивание в этих участках, то можно заметить много негомологичных фрагментов. Это позволяет предположить, что хоть последовательности и сходны в этих местах, гомологичными они вряд ли являются.

Поиск гомологов среди эукариотов

       После поиска гомологов в общем, я нашла, сколько гомологов данной пептидазы среди белков эукариотных организмов. Для этого в BLAST есть параметры поиска: я задала в поле Organism - eukaryotes (taxid:2759). В итоге нашлось 7 эукариотных гомологов, причём у которых E-value довольно маленькое - самое большое имеет значение 2e-11. Все найденные белки относятся к классу митохондриальных металлоэндопептидаз, причём 5 из 7 белков - предшественники. Все найденные гомологи представлены на рисунке 3.

Рисунок 3. Таблица эукариотных гомологов пептидазы М48 из G.sulfurreducens.

Построение множественного выравнивания

       Следующим шагом было получение множественного выравнивания найденных гомологов - я выбрала первые 15 последовательностей. Данное выравнивание получено следующим образом: выделить нужные последовательности -> Multiply alignment -> download fasta. Результат представлен на рисунке 4 (окраска ClustalX, консервативность более 40%). Как видно из рисунка, вертикальных блоков не так уж много, так что трудно говорить о гомологичности данных последовательностей. В данном выравнивании 21 функционально консервативных колонок (посчитано при консервативности 0%) - 3% и 11 консервативных колонок (при консервативности 100%) - 1,5%. Такие маленькие значения лишь подтверждают то, что данное выравнивание вряд ли достоверное.

Рисунок 4. Множественное выравнивание белков-гомологов.

       Скачать данный проект и fasta-файл с выравниванием можно здесь: .fasta и .jar.

© Mukhaleva Elizaveta, FBB MSU, 2013
Дата последнего изменения: 01.05.2014

Valid HTML 4.01 Strict Правильный CSS!