Семестры
Сайт ФББ МГУ
Kodomo Wiki
NCBI

RanHummer personal web-site


Выравнивание и гомология


Для выполнения выравнивания было взято множественное выравнивание №03, последовательности 6 белков, которые представлены в данном fasta-файле. Проект в формате .jvp можно скачать по ссылке.

Задание 1.

Для начала последовательности были отсортированы с помощью дерева методом Neighbour Joining Using BLOSUM62 (рис.1). Затем были получены изображения выравнивания с раскраской BLOSUM62 с порогом консервативноcти 30 и ClustalX (рис.2 и рис.3 соответственно).

Рис.1. Дерево родства последовательностей из файла align_03.fasta.

Рис.2. Множественное выравнивание последовательностей из файла align_03.fasta с раскраской BLOSUM62 с порогом консервативности 30.

Рис.3. Множественное выравнивание последовательностей из файла align_03.fasta с раскраской ClustalX с порогом консервативности 30.

Задание 2. Поиск участков, на которых можно ожидать гомологию аминокислотных остатков из разных последовательностей.

Результаты задания приведены на рисунке 4.

Рис.4. Разметка блоков (В), кластеров блоков (С) и самого длинного участка, не входящего в блоки и кластеры (Х) на множественном выравнивании (файл align_03.fasta, раскраска BLOSUM62).

  1. Вертикальный блок - участок множественного выравнивания не менее чем 5 последовательностей, обладающий следующими свойствами:
    • Не содержит гэпов.
    • Длина - не менее 4 колонок.
    • Первая и последняя колонки - абсолютно консервативны или абсолютно функционально консервативны.
    • Не содержит более 3 колонок, не являющихся абсолютно консервативными или абсолютно функционально консервативными, подряд.
    • Не может быть расширен без нарушения предыдущих свойств.

    Исходя из этих свойств, было обнаружено 7 блоков (в строке BLOCKS обозначено буквой B). Также для определения функционально консервативных позиций были спользованы следующие критерии свойств аминокислот: все гидрофобные, все гидрофильные, все ароматические, все положительно заряженные, все отрицательно заряженные, сходные по структуре доноры или акцепторы водородных связей.

  2. Кластер блоков - участок выравнивания, на котором можно ожидать гомологию между любыми двумя аминокислотами, расположенными в одной колонке. Кластер, в отличие от блока, может содержать гэпы. Два блока объединяются в кластер вместе с участком между ними, если все гэпы между этими блоками имеют длину, равную длине участка между ними. Мной было обнаружено 2 кластера, состоящих более чем из одного блока (в строке BLOCKS обозначено буквой С).
  3. Также на рисунке 4 в строке разметки BLOCKS буквой X обозначен самый длинный участок выравнивания, не входящий в состав блоков и кластеров.
  4. На рисунке 5 выделена группа последовательностей BUTPB и CELLD, при сравнении которых с остальными последовательностями выравниваний были найдены на которых остатки выбранных последовательностей, предположительно, гомологичны, а остатки остальных - скорее негомологичны им. К тому же они составляют отдельную эволюционную группу на дереве, построенном для выравнивания (рис.1). Символом H отмечены участки на которых видны отличия этих последовательностей от всех остальных. В позициях 18-20, 82-83, 145 наблюдается заметное функциональное различие остатков внутри группы и вне её.

Рис.5. Выделение группы последовательностей BUTPB и CELLD на фоне выравнивания, раскрашенного по способу BLOSUM62, разметка участков, на которых остатки выбранных последовательностей, предположительно, гомологичны, а остатки остальных - скорее негомологичны им.

Задание 3.

Для блока 30-54 было посчитано число и процент абсолютно консервативных позиций; абсолютно функционально консервативных (согласно раскраске ClustalX); консервативных и функционально консервативных на 70%.

Табл. 1. Консервативные позиции для кластера 30-54.
Позиция Число Процент
Абсолютно консервативные 14 56%
Абсолютно функционально консервативные 4 16%
Консервативные на 70% 2 8%
Функционально консервативные на 70% 0 0%

Для самого длинного участка выравнивания, не входящего в состав блоков и кластеров (задание 2c) было посчитано число и процент позиций с гэпами.

Табл. 2. Число и процент позиций с гэпами для наибольшего не задействованного участка.
Участок Число гэпов Процент гэпов
55-94 3 7,5%

Задание 4.

Для этого задания к выравниванию была добавлена последовательность sequence_03.fasta. Затем последовательность была вручную вписана в выравнивание с наибольшим возможным количеством значимых позиций. Результат представлен на рисунке 6.

Рис 6. Изображение выравнивания с дополнительно вписанной последовательностью из файла sequence_03.fasta (SYNLT).

Задание 5.

Для выполнения данного задания была добавлена негомологичная последовательность белка YP_004610222. Гэпы были добавлены в тех участках выравнивания, где они есть в выровненных последовательностях. В результате было получено 3 абсолютно консервативные позиции, 11 функционально консервативных позиций из 157 позиций, что составляет 8,9%.

Табл. 3. Число и процент консервативных позиций для негомологичной последовательности.
Всего позиций Абсолютно консервативные позиции Функционально консервативные позиции
157 3 11
100% 1,9% 7%

Рис.7. Изображение выравнивания с дополнительно вписанной последовательностью из файла YP_004610222.fasta.

Задание 6. Построение множественного выравнивания заведомо негомологичных последовательностей.

Для выполнения этого задания я использовал последовательности 5 белков, с которыми работали мои однокурсники. AC выбранных белков в базе данных PDB: 2PMD, 3AMU, 3GBR, 3ICP, 1ML4. Выравнивание было построено с помощью команды "Muscle with Default". Результат представлен на рисунке 8.

Рис.8. Изображение множественного выравнивания заведомо негомологичных последовательностей.

В результате была найдена только 1 абсолютно консервативная позиция. Заведомо негомологичные последовательности имеют очень малое число консервативных позиций. Мне не удалось с достаточной уверенностью найти блоки в выравнивании из 5-и последовательностей, однако, построив дерево гомологии и с его помощью выделив 3 последовательности, мне удалось найти 5 похожих на блоки подпоследовательностей. Однако, только в 1 случае (365-369) блок достаточно правдоподобен. Следовательно, судить о гомологии таких последовательностей нельзя.


© Поляков Игорь aka RanHummer