Учебный сайт Софроновой Алины
Предсказание парных выравниваний

        Для осуществления выравнивания я использовала программу под названием Jalview. Последовательности были взяты из данного файла . Выравние целиком представлено на Рис.1.

Рис.1. Множественное выравнивание. Раскраска Clustalx. Консервативность более 70%.

        Далее я получила парное выравнивание последних двух последовательностей из множественного (Рис.2). Для этого удалила из множественного выравнивания все остальные последовательности и все пустые колонки.

Рис.2. Парное выравнивание последних двух последовательностей. Раскраска Clustalx. Консервативность более 70%.
Проект с данным выравниванием можно скачать здесь.

        Для того, чтобы постройть глобальное выравнивание последних двух последовательностей, я воспользовалась пакетом EMBOSS - Needle. Полное или глобальное выравнивание – это выравнивание биологических последовательностей по их полной длине. Результат сохранен в двух форматах .needle и .fasta. Выравнивание изображено на Рис.3.

Рис.3. Глобальное парное выравнивание. Раскраска Clustalx. Консервативность более 70%.

        Для того, чтобы постройть локальное выравнивание последних двух последовательностей, я воспользовалась пакетом EMBOSS - Water. Частичное или локальное выравнивание – выравнивание части биологических последовательностей.Результат сохранен в двух форматах .water и .fasta. Выравнивание изображено на Рис.4.

Рис.4. Локальное парное выравнивание. Раскраска Clustalx. Консервативность более 70%.
Проект выравнивания гомологичных белков можно просмотреть здесь.

        Далее, действуя аналогично, я построила парное выравнивание последовательностей двух заведомо негомологичных белков с индентификаторами YP_002755686.1 и YP_749235.1 в базе данных RefSeq. Последовательности в fasta-формате можно просмотреть здесь YP_002755686.1, YP_749235.1. Глобальное и локальное выравнивание изображено на Рис.5 и Рис.6 соответственно. Далее можно ознакомиться с результатом глобального выравнивания в .needle и .fasta формате и локального в .water и .fasta формате.

Рис.5. Глобальное парное выравнивание заведомо негомологичных белков. Раскраска Clustalx. Консервативность более 70%.
Рис.6. Локальное парное выравнивание заведомо негомологичных. Раскраска Clustalx. Консервативность более 70%.
Проект выравнивания негомологичных белков можно просмотреть здесь.

        Для анализа полученных выравниваний я посторила таблицу (Таблица 1), где указала длину последовательности, число и процент совпадений, число и процент сходных остатков, а так же число и процент гэпов и количество открытых гэпов. Для гомологичных белков наблюдается высокий показатель процента совпадений (30-35%) и сходных остатков (53-61%). Число совпадений и число сходных остатков совпадает и в локальном и в глобальном выравнивании, их отличие лишь в длине и открытии гэпов. Что вполне логично, т.к. для глобального выравнивания необходимо полное выравнивание последовательности, а для локального отдельных частей, поэтому несовпадающие части отсутствуют. Процент гэпов для гомологичных белковсоставляет 11-18%. Другая картина наблюдается для негомологичных белков. Процент совпадений (21-25%) и сходных остатков (28-32%) значительно ниже, чем для гомологичных белков. Процент гэпов варьирует от 50% до 56%, что так же показывает негомологичность этих двух последвательностей.

Таблица 1. Таблица параметров парного выравнивания для гомологичных и негомологичных белков.

Вид последовательностей Тип выравнивания Длина выравнивания Число совпадений Процент совпадений Число сходных остатков Процент сходных остатков Число гэпов Процент гэпов Число открытий гэпов
Гомологичные белки из множественного выравнивания Выравнивание в программе Jalview 131 35 26,7% 56 42.7% 21 16% 6
Гомологичные белки из множественного выравнивания глобальное 133 41 30.8% 71 53.4% 25 18.8% 10
локальное 116 41 35.3% 71 61.2% 13 11.2% 8
Заведомо негомологичные белки глобальное 591 126 21.3% 169 28.6% 335 56.7% 68
локальное 488 125 25.6% 160 32.8% 245 50.2% 63

        Далее я сравнила выравнивание двух последних последовательностей из множественного выравнивания и глобальное выравнивание этих двух последовательностей. Результат представлен на Рис.7.

Рис.7. Сравнение двух парных выравниваний. Раскраска Clustalx. Консервативность более 70%.

        Для наилучшего совпадения этих двух выравниваний, я кое где вставляла гэпы в первое выравнивание. Было множество совпадающих участков, редко встречались несовпадающие участки. На Рис.8 изображен один из участков расхождения выравниваний (выделен красной рамкой) состоящий из 2 позиций, координаты этого участка в общем выравнивании - 66-67№. Слева и справа от него участки полностью совпавшие.


Рис.8. Участок несовпадения двух парных выравниваний, выделен красной рамкой. Раскраска Clustalx. Консервативность более 70%.
Проек с выравниванием можно просмотреть здесь.

        Я проверила парное выравнивание, полученное из множественного и глобальное парное выравнивания, совмещая пространственные структуры в программе RasMol. "+" отмечены колонки, где выравнивание можно считать достоверным. Я стовила "+" на основе протяженности консервативных участков и на основе нахождения этого участка во множественном выравнивании. "S" отмечены колонки аминокислот с совпадающими CA атомами. "1" - ошибка первого рода - структуры не совмещаются, но + стоит. "2" - ошибка второго рода - структуры явно совмещаются, но + не стоит. Результат проверки для парного выравнивания из множественного приведен на Рис.9, глобального парного выравнивания на Рис.10.

Рис.9. Проверка парного выравнивания из множественного. Раскраска Clustalx. Консервативность более 70%.
Рис.10. Проверка глобального парного выравнивания. Раскраска Clustalx. Консервативность более 70%.

Вернуться к 2 семестру

© Алина Софронова, 2013
Дата последнего изменения: 28.11.2013