Учебный сайт Макаровой Надежды

Второй семестр
Все материалы находятся в JalView проекте

Раскраска выравнивания

Было дано множественное выравнивание


Изображение выданного выравнивания было создано с помощью программы JalView. Ниже представлены два способа раскраски: BLOSUM62 и ClustalX. Оба по порогу косервативности 30. Последовательности в выравнивании отсортированы по сходству.

Рис1. Раскраска по BLOSUM62 (Символами "В" обозначены колонки, входящие в блок; "С" - учасики между блоками входящими в кластер; "X" - самый длинный участок, не включенный ни в блок, ни в кластер.)
Рис2. Раскраска по ClustalX

Поиск блоков и кластеров

В задании нужно было определить участки, которые могут входить в состав блока. Для этого сначала были определены колонки гэпов, т.к. гэпы не могут входить в блоки и, следовательно, могут разделять их. Но, к сожалению, в выравнивании всего 4 колонки гэпов, тогда как длина последовательности в выравнивании 235.


Из раскарски BLOSUM62:

См. рис1. На первый взгляд сразу определяется "структура" выравнивания. Сначала идут три блока разделенные колонками с гэпами, длиной 8 и 4. Затем идет длинная (107 колонок) синяя область. В ней между абсолютно консервативными и функционально консервативными колонками, во-первых, нет гэпов, во-вторых, есть неокрашенные колонки, содержащие аминокислоты, которые, однако, можно объединить на основе их гидрофильности. Единственное сомнение, мешающее однозначно определить эту область как блок, это ее размер.
После идут 4 блока. Разделяются они только колонками без гэпов. Эти блоки отделены от большого блока 9 колонками 2 из которых содержат гэпы.


Далее стояла задача найти кластеры.
Есть два варианта: либо объединять блоки, либо объединять блоки с соседними колонками (которые несмотря на всю похожесть не являются функционально консервативными) Понятие кластера нечетко определимо. В данном случае между блоками стоит максимум 2 колонки гэпов. Следовательно, разделяемыми самое большое 8 колонками блоки по идее должны все собираться в кластер. Однако что-то мешает сделать такой вывод. Поэтому блоки были объеденены в разные кластеры.


Для упрощения задачи были взяты две последовательности, которые согласно дереву имеют наиболее близкое выравнивание. Выбор фрагмента основывался на высоком сходстве этих последовательностей между собой при отсутствии сходства с другими последовательностями.


Оценка сходства

Чтобы иметь представления о количестыенном соотнешении в настоящих (правильных) выравниваниях были произведены некоторые расчеты. Для сравнения были выбраны 2 блок разного размера. Результаты представлены в таблице.

Таблица процентного содержания гомологичных участков.

Абсолютно консервативные позиции (число, процент) Функционально консервативные позиции (число, процент) Абсолютно консервативные позиции на 70% (число, процент) Функционально консервативные позиции на 70% (число, процент)
1 блок (15 колонок) 6, 40% 4, 27% 6, 40% 3, 20%
2 блок (107 колонок) 53, 49% 32, 30% 53, 49% 18, 17%

Также былорасчитано процентное соотношение числа гэпов в самом длинном участке, который не входит в кластер: 12.5%

Была выдана дополнительная последовательность, которую нужно было вручную выровнять вместе с другими (режим "стрелки")

Далее чтобы убедиться в том, что подогнать (выровнять) можно все что угодно, но это не всегда будет иметь смысл, была добавлена заведомо негомологичная последовательность белка с индентифекатором YP_008011580.1.

Максимальное число полностью консервативных позиций: 9 ;
Их процент: 6.8% ;
Максимальное число консервативных позиций (вместе с функционально): 25 ;
их процент: 17% ;

Затем были выбраны 6 рандомных белков. Было построено их множественное выравнивание.