Выравнивание аминокислотных последовательностей белков. Jalview.

Выравнивание аминокислотных последовательностей — биоинформатический метод, основанный на размещении двух или более последовательностей друг под другом так, чтобы совместить сходные участки в этих последовательностях. При этом между аминокислотами выравниваемых последовательностей допустима вставка символа "гэп", что позволяет расположить гомологичные элементы друг под другом.

Для работы было выбрано выравнивание, предложенное на сайте Kodomo. Выравнивание обрабатывалось при помощи редактора Jalview. результаты работы над выравниванием представлены по ссылке: Maslova_1.jar

Выбор гомологичных участков

Поиск участков выравнивания, содержащих гомологичные участки белков, осуществляется визуально. При этом для выравнивания устанавливается окраска ClustalX и параметр "Above identity threshold" 70%. Участки выравнивания, видимо являющиеся гомологичными у данных белков, представлены на рис.1 и рис.2.


Рис.1. Фрагмент выравнивания, содержащий гомологичные участки последовательностей

Рис.2. Фрагмент выравнивания, содержащий гомологичные участки последовательностей

Также был выделен участок, на котором гомологией обладают по-видимому только две последовательности из данных. Для этого сначало было построено дерево сходства последовательностей (Calculate tree: Average distance using BLOSUM62), показанное на рис.3.


Рис.3. Дерево сходства последовательностей

По данному дереву были выбраны два белка, находящиеся ближе всего друг к другу - tr|Q333M6|Q333M6_9AVES и tr|Q2VCE0|Q2VCE0_9AVES. Затем был выбран участок, представленный на рис.4, на котором данные две последовательности помещены на верхние строчки, ниже расположены остальные белки. Из рис.4 видно, что последовательности tr|Q333M6|Q333M6_9AVES и tr|Q2VCE0|Q2VCE0_9AVES на данном участке идентичны друг другу, а остальные белки имеют мало совпадений с ними, а значит, не гомологичны им.


Рис.4. Фрагмент выравнивания, содержащий участок двух гомологичных последовательностей. Гомологичные последовательности перемещены на первые строчки.

Число консервативных и функционально консервативных позиций в блоке

Для выполнения данного задания был выбран блок, изображенный на рис.2.

Всего в нем 18 позиций. Из них абсолютно консервативных (одинаковые аминокислоты) - 9. Функционально консервативных (в раскраске ClustalX - одинаковый цвет столбцов) - 10. При выставлении параметра "Above identity threshold" 70% функционально и фактически консервативных позиций по 15.

Таким образом, процентное распределение следующее: (см. таблицу 1)

Таблица 1. Процент консервативности позиций в блоке
Параметр %
Абсолютно консервативные позиции 50%
Функционально консервативные позиции 55.56%
Абсолютно консервативные позиции на 70% 83.33%
Функционально консервативные позиции на 70% 83.33%

Участок выравнивания, содержащий "гэпы"

В выравнивании был выбран участок, представленный на рис.5. Он содержит два вертикальных блока и участок, не являющийся гомологичным у выбранных белков.


Рис.5. Фрагмент выравнивания, содержащий негомологичный участок

Всего в данном участке 3 позиции с гэпами, что составляет 42.85% от его длины (участок без гомологии считать с 5 по 11 столбец на рис.5.)

Добавление новой последовательности

В выравнивание была добавлена еще одна последовательность и выровнена относительно блока, представленного на рис.2. Для этого использовался запрос в форме следующего вида:

TL.C.A..FYP

Результат выравнивания показан на рис.6.


Рис.6. Фрагмент выравнивания с добавлением новой последовательности

В формате проэкта данное выравнивание можно посмотреть по ссылке Maslova_2.jar

Консесусная последовательность и и лого выбранного блока

Консенсусная последовательность блока с рис.2 была скопирована из JalView и представленна ниже.

>Consensus/1-18 Percentage Identity Consensus
TLRCWALGFYPAEITLTW

LOGO выравнивания можно видеть на рис.7. Оно было получено при помощи сервиса http://weblogo.berkeley.edu/logo.cgi


Рис.7. LOGO выравнивания

Выравнивание негомологичных последовательностей

Для построения данного выравнивания были случайным образом выбраны белки из списка. При помощи сервиса ID Mapping на сайте Uniprot были вычислены AC для выбранных белков. Затем было построено их выравнивание. Проэкт с выравниванием выложен по ссылке: Maslova_3.jar .

Участки с наибольшей гомологией представленны на рис.8 и рис.9.


Рис.8. Участок, содержащий гомологичные позиции в выравнивании

Рис.9. Участок, содержащий гомологичные позиции в выравнивании

Поскольку как на данных участках, так на всей длине выравнивания белки совпадают лишь в единичных позициях, можно сделать вывод о полном отсутсвии гомологических связей между ними.

© Маслова Валентина, 2014
Последнее изменение: 15.04.2014