Учебный сайт Полины Байкузиной

Главная Семестры О себе Ссылки

Выравнивание и гомология

Для выполнения выравнивания было взято множественное выравнивание №09, последовательность 6 белков, которые представлены в данном fasta-файле. Проект в формате .jvp можно скачать по ссылке.

Задание 1.

Для начала последовательности были отсортированы с помощью дерева методом Neighbour Joining Using BLOSUM62 (рис.1). Затем были получены изображения выравнивания с раскраской BLOSUM62 с порогом консервативноcти 30 и ClustalX (рис.2 и рис.3 соответсвенно).

Рис.1. Дерево родства последовательностей из файла align_09.fasta.

Рис.2. Множественное выравнивание последовательностей из файла align_09.fasta с раскраской BLOSUM62 с порогом консервативности 30.

Рис.3. Множественное выравнивание последовательностей из файла align_09.fasta с раскраской ClustalX с порогом консервативности 30.

Задание 2. Поиск участков, на которых можно ожидать гомологию аминокислотных остатков из разных последовательностей.

Результаты задания приведены на рисунке 4.

Рис.4. Разметка блоков (В), кластеров блоков (С) и самого длинного участка, не входящего в блоки и кластеры (Х) на множественном выравнивании (файл align_09.fasta, раскраска ClustalX).

a) Вертикальный блок - участок множественного выравнивания не менее чем 5 последовательностей, обладающий следующими свойствами:

  • Не содержит гэпов.
  • Длина - не менее 4 колонок.
  • Первая и последняя колонки - абсолютно консервативны или абсолютно функционально консервативны.
  • Не содержит более 3 колонок, не являющихся абсолютно консервативными или абсолютно функционально консервативными, подряд.
  • Не может быть расширен без нарушения предыдущих свойств.
Исходя из этих свойств, было обнаружено 12 блоков (в строке BLOCKS обозначено буквой B). Также для определения функционально консервативных позиций были спользованы следующие критерии свойств аминокислот: все гидрофобные, все гидрофильные, все ароматические, все положительно заряженные, все отрицательно заряженные, сходные по структуре доноры или акцепторы водородных связей.

b) Кластер блоков - участок выравнивания, на котором можно ожидать гомологию между любыми двумя аминокислотами, расположенными в одной колонке. Кластер, в отличие от блока, может содержать гэпы. Два блока объединяются в кластер вместе с участком между ними, если все гэпы между этими блоками имеют длину, равную длине участка между ними. Мной было обнаружено 4 кластера (в строке BLOCKS обозначено буквой С).

c) Также на рисунке 4 в строке разметки BLOCKS буквой X обозначен самый длинный участок выравнивания, не входящий в состав блоков и кластеров.

d) На рисунке 5 выделена группа последовательностей STRR6 и LACLK, при сравнении которых с остальными последовательностями выравниваний были найдены на которых остатки выбранных последовательностей, предположительно, гомологичны, а остатки остальных - скорее негомологичны им. Эти последовательности имеют примерно одинаковую длину (266 и 268 аминокислотных остатков) в отличие от других последовательностей. К тому же они составляют отдельную эволюционную группу на дереве, построенном для выравнивания (рис.1). Символом H отмечены участки на которых видны отличия этих последовательностей от всех остальных. В позициях 97-103, 107-109, 195-198 наблюдается значительное функциональное различие остатков внутри группы и вне её.


Рис.5. Выделение группы последовательностей STRR6 и LACLK на фоне выравнивания, раскрашенного по способу BLOSUM62, разметка участков, на которых остатки выбранных последовательностей, предположительно, гомологичны, а остатки остальных - скорее негомологичны им.

Задание 3.

Для блока 136-167 было посчитано число и процент абсолютно консервативных позиций; абсолютно функционально консервативных (согласно раскраске ClustalX); консервативных и функционально консервативных на 70%.
Позиция Число Процент
Абсолютно консервативные 14 43,75%
Абсолютно функционально консервативные 8 25%
Консервативные на 70% 4 12,5%
Функционально консервативные на 70% 2 6,25%

Для самого длинного участка выравнивания, не входящего в состав блоков и кластеров (задание 2c) было посчитано число и процент позиций с гэпами.

Число позиций с гэпами - 9.

Процент позиций с гэпами - 47,4%.

Задание 4.

Для этого задания к выравниванию была добавлена последовательность sequence_09.fasta. Затем последовательность была вручную вписана в выравнивание с наибольшим возможным количеством значимых позиций. Результат представлен на рисунке 6.

Рис.6. Изображение выравнивания с дополнительно вписанной последовательностью из файла sequence_09.fasta (THEIA).

Задание 5.

Для выполнения данного задания была добавлена негомологичная последовательность белка НАД-зависимой эпимеразы-дегидратазы бактерии Desulfurococcus kamchatkensis ( fasta-файл). Гэпы были добавлены в тех участках выравнивания, где они есть в выровненных последовательностях. В результате было получено 5 абсолютно консервативные позиции, 44 функционально консервативных позиций их 275 позиций, что составляет 16%.

Рис.7. Изображение выравнивания с дополнительно вписанной последовательностью из файла YP_002427953.fasta.

Задание 6. Построение множественного выравнивания заведомо негомологичных последовательностей.

Для выполнения этого задания я использовала последовательности 5 белков, с которыми работают мои однокурсники. AC выбранных белков в базе данных UniProt: Q6L1N7; R4T2E1; O67781; F4BY60; I0I273. Выравнивание было построено с помощью команды "Muscle with Default". Результат представлен на рисунке 8.

Рис.8. Изображение множественного выравнивания заведомо негомологичных последовательностей.

В результате был найден только 1 участок. Заведомо негомологичные последовательности имеют довольно малое число консервативных позиций. Следовательно, судить о гомологии таких последовательностей нельзя.


© Полина Байкузина, 2014