Учебный сайт Саши Погорельской Эмблема
Главная Семестры Скрипты Обо мне Ссылки
1 семестр
2 семестр
3 семестр
4 семестр
7 семестр
Белок
Лиганды
Trp-synthase
Prusiner SB
Uniprot
ATP-synthase
Выравнивание
BLAST
Pfam
Мотивы
Множественные выравнивания Парные выравнивания

Построение парного выравнивания

Для выполнения практикума используется множественное выравнивание и PDB-файл с совмещением 2 структур. Это структуры двух последних белков, при удалении других белков и пустых колонок получается файл с парным выравниванием. Графическая интерпретация исходного множественного и парного выравниваний сохранена в проекте Jalview.

1 2

Рисунок 1. Часть глобального выравнивания, с 30 по 55 остатки

Рисунок 2. Часть локального выравнивания, с 20 по 46 остатки

Для построения глобального выравнивания, часть которого изображена на рисунке 1, я использовала программу needle из пакета EMBOSS. Исходными файлами для работы этой программы являются 2 файла в формате fasta с аминокислотными последовательностями. По умолчанию выходной файл выглядит так. Для сохранения файла в формате fasta используется опция -aform fasta (такой выходной файл).

Аналогично можно сделать локальное выравнивание, с помощью программы water. Здесь можно скачать файл с выравниваем по умолчанию, а здесь - в формате fasta.

На рисунках 1 и 2 приведены одинаковые фрагменты последовательностей, различаются только номера остатков. Есть скачать проект с этими двумя выравниваниями, то можно легко проверить полное совпадение выравниваний. Так как локальное выравнивание не обязано распространяться на всю последовательность, концевые фрагменты отрезаны.

Теперь проведем аналгоичные действия с заведомо негомологичными последовательностями. Для глобального выравнивания: файл с описанием выравнивания, в формате fasta. Те же файлы для локального выравнивания: текстовый и fasta.

Частично эти выравнивания изображены на рисунках 3 и 4. Глобальное выравнивание содержит очень много гепов, фрагменты сходства короткие.

Характеристики всех этих выравниваний получены с помощью функции infoalign (EMBOSS). Наиболее значимые сведения представлены в таблице 1. В колонке SeqLen - длина последовательности, AlignLen - длина выравнивания без учета гепов на конце. Количество открытий гепов указано в колонке Gaps, а их общая длина - GapLen.

В колонке Ident таблицы 1 для первой последовательности указывается количество всех аминокислотных остатков, а для второй - количество полностью совпадающих. Similar - сходные остатки. Для гомологичных последовательностей лучшим локальным выравниванием является глобальное (без гепов на конце), для заведомо негомологичных - лишь небольшой участок длиной в 12 остатков.

Таблица 1. Сведения о полученных выравниваниях

Name SeqLen AlignLen Gaps GapLen %Gap Ident %Ident Similar %Similar
Given sequences
given alignment
1IXX_A 129 133 1 4 3.008 129 0
2ZIB_A 133 144 3 11 7.639 46 31.94 18 12.5
total
1IXX_A 129 137 2 8 5.839 129 0
2ZIB_A 133 148 4 15 10.135 54 36.5 21 14.18
local
1IXX_A 126 134 2 8 5.970 126 0
2ZIB_A 119 134 4 15 11.194 43 32.1 21 15.67
Not homologous sequences
total
O28271_ARCFU_1-106 106 151 7 45 29.80 106 0
Q9YEQ6_AERPE_1-178 178 205 3 27 13.17 132 64.4 14 6.829
local
O28271_ARCFU_1-106 12 12 0 0 0 12 0
Q9YEQ6_AERPE_1-178 12 12 0 0 0 7 58.3 1 8.333
3 4

Рисунок 3. Часть глобального выравнивания заведомо негомологичных последовательностей, с 60 по 79 остатки.

Рисунок 4. Локальное выравнивание заведомо негомологичных последовательностей

Для сравнения исходного выравнивания и результата работы программы needle я в Jalview построила их выравнивание. Не изменяя выравниваний, я добавила несколько гепов во второе парное выравнивание. При этом совпала большая часть парных выравниваний. Участок с 35 по 48 с покраской BLOSUM62 изображен на рисунке 5.

Это отличие заключается только в том, чему ближе аспарагин: глутаминовой кислоте (E) или аланину (A). Это не имеет значения, так как аспарагин с аланином объединяет размер радикала и отсутствие заряда. С другой стороны, глутаминовая кислота может быть легко изменена в аспарагин, если в данном месте белка заряд не имеет большого значения. Поэтому качество обоих выравниваний совпадает.

5

Рисунок 5. Участок различия между данным и полученным глобальным выравниваниями, с 35 по 48 остатки

Полностью результаты можно посмотреть, если скачать исходный проект.

Для проверки правильности выравнивания (то есть вероятности гомологии) можно использовать также пространственную структуру белков. Гомологичные белки обладают сходными функциями и, значит, сходным строением. С помощью программы SupCheck можно получить скрипт, который последовательно выделяет колонки выравнивания при запуске в RasMol.

Для выравниваний, полученных изначально и с помощью needle, я проанализировала соответствие пространственных структур. В проекте Jalview в строках Correct alignment совмещенные остатки отмечены буквой "S". Колонки, которые я считаю выравненными достаточно достоверно, отмечены знаком "+".

Рассмотрим возникшие ошибки. Ошибки первого рода: аминокислотные остатки отмечены "+", но не совмещены. Ошибки второго рода: остатки совпадают в структуре, но в разных колонках или не отмечены "+". Для исходного выравнивания найдено 16 ошибок первого рода и 26 ошибок второго рода. Для глобального выравнивания (needle) 18 - первого рода и 29 - второго.





© Pogorelskaya Sasha Last modification date: 19.02.15