Практикум 8
Взял выравнивание align_04.fasta.
Задание 1
По данному выравниванию построил дерево с помощью Neighbour Joining Using BLOSUM62 (рис 1.1). Далее раскрасил с помощью ClustalX (рис 1.2) и Blosum 62 (рис 1.3). Везде порог консервативности 30.
Рис 1.1. Дерево родства последовательностей
Рис 1.2. Раскраска ClustaalX
Рис 1.3. Раскраска Blosum 62
Задание 2
Нашел участки, на которых можно ожидать гомологию аминокислотных остатков из всех последовательностей: вертикальные блоки (а), кластеры (b), а также были выделены участок, не входящий в блоки и кластеры (с) и невертикальный блок (d).
a) Критерии выделения вертикального блока:
• Он найден на участке множественного выравнивания не менее 5 последовательностей.
• Не содержит гэпов.
• Длина - не менее 4 колонок.
• Первая и последняя колонки - абсолютно консервативны или абсолютно функционально консервативны.
• Не содержит более 3 колонок, не являющихся абсолютно консервативными или абсолютно функционально консервативными, подряд.
• Не может быть расширен без нарушения предыдущих свойств.
Свойства аминокислот, позволяющие судить о функциональной консервативности позиции:
• все гидрофобные
• все гидрофильные
• все ароматические
• все положительно заряженные
• все отрицательно заряженные
• сходные по структуре доноры или акцепторы водородных связей
В соответствии с изложенными критериями выделил 6 блоков (На Рис. 2.1 в строке разметки Рarts отмечены буквой "B").
b) Кластер блоков - участок выравнивания, на котором можно ожидать гомологию между любыми двумя аминокислотами, расположенными в одной колонке. Критерий выделения кластера: два блока объединяются в кластер вместе с участком между ними, если все гэпы между этими блоками имеют длину, равную длине участка между ними (то есть кластер, в отличие от блока, может содержать гэпы). исходя из этого выделил 5 кластера, причем четыре из них состоят из 1 блока и один из двух (На Рис. 2.1 в строке разметки Рarts отмечены буквой "С").
c) Также было выделено два самых длинных участка, не входящих ни в блоки, ни в кластеры (оба по 10 колонок) (На Рис. 2.1 в строке разметки Рarts отмечены буквой "Х").
Рис. 2.1. Изображение блоков (В), кластеров блоков (С) и самого длинного участка, не входящего в блоки и кластеры (Х) (раскраска ClustalX).
d) На Рис. 2.2 черной рамкой выделена группа из двух последовательностей: STAAC и MACCJ. Причины выбора именно этих двух последовательностей:
• Они имеют одинаковую длину, отличную от длин остальных последовательностей (81 колонка).
• Они составляют отдельную эволюционную группу на дереве, по которому можно судить о родстве последовательностей (Рис. 1.1).
• На самом длинном участке выравнивания, не имеющем блоков и кластеров (Рис. 2.1 – “C”) эти последовательности сильно отличаются от остальных: они имеют одинаковые остатки в этих позициях, тогда как 3 другие последовательности содержат длинный гэп в этом месте, а в еще 1 последовательности в данных позициях содержатся совершенно функционально несхожие остатки (см. Рис. 2.2).
В ходе сравнения выделенной группы с остальными последовательностями были найдены участки, на которых можно судить о гомологии между остатками выделенных в группу последовательностей, а остатки остальных последовательностей им, предположительно, негомологичны. Такие участки на Рис. 2.2 в строке разметки Group обозначены буквой H.
Рис. 2.2. Группа последовательностей STAAC и MACCJ на фоне выравнивания (раскраска BLOSUM62). Участки, на которых остатки выбранных последовательностей, предположительно, гомологичны, а остатки остальных - скорее негомологичны им, в строке разметки Group обозначены символом H.
Задание 3
Для первого блока (см. Рис. 2.1 - обозначен в строке разметки буквой В, 4 - 22 колонки) были определены число и процент абсолютно консервативных и функционально консервативных (согласно раскраске ClustalX), а также консервативных и функционально консервативных на 70%
Тип позиции |
Число позиций |
Процент |
Абсолютно консервативные |
4 |
21,05% |
Абсолютно функционально консервативные |
7 |
36,84% |
Консервативные на 70% |
5 |
26,31% |
Функционально консервативные на 70% |
5 |
26,31% |
Для одного из самоых длинного (30-40 колонки) участка выравнивания, не входящего в состав блоков и кластеров (Рис. 2.1 - обозначен в строке разметки буквой Х) были посчитаны:
• Число позиций с гэпами: 5
• Процент позиций с гэпами: 50%
Задание 4
В данном задании было необходимо вписать последовательность sequence_04.fasta в выравнивание с наибольшим числом значимых позиции (см. результат на Рис. 3).
Рис. 3. Изображение выравнивания с дополнительно вписанной последовательностью из файла sequence_04.fasta (Раскраска ClustalX).
Задание 5
В данном задании я попытался вписать в выравнивание заведомо негомологичную последовательность – последовательность моего белка – гипотетического белка у организма Vulcanisaeta moutnovskia 768-28 (идентификатор в БД RefSeq YP_004243986.1), так как белок слишком большой, я взял участок длиной 80 остатков из середины последовательности (см. результат на Рис. 4).
Разрешалось вносить гэпы в те участки, где уже были гэпы в исходном выравнивании, чтобы найти найбольшее количество совпадений со значимыми позициями в исходном выравнивании.
Удалось получить:
• 1 абсолютно консервативная позиция
• 22 функционально консервативных позиций (и абсолютных, и консервативных на 70)
• 5 позиций, консервативных на 70%
• Общий процент совпадений: 22,22%
Такой маленький процент совпадений позволяет судить о негомологичности участка последовательности моего белка остальным последовательностям.
Рис. 4. Изображение выравнивания с дополнительно вписанной последовательностью участка белка YP_004243986.1 (Раскраска ClustalX).
Задание 6
В этом задании было необходимо построить множественное выравнивание заведомо негомологичных последовательностей (Рис. 5), например, последовательностей, с которыми работают другие студенты моего курса. Я выбрал 5 последовательностей (идентификаторы AC в базе данных Uniprot): H6Q874, F0QTE2, F4BY60, I0I273, Q6L1N7. Выравнивание было построено с помощью опции "Muscle with Default" (см. Рис. 5).
Рис. 5. Изображение множественного выравнивания заведомо негомологичных последовательностей (Раскраска BLOSUM62).
В данном выравнивании был найден всего один блок (на Рис. 6 – обозначен символом «В» в строке разметки Blocks).
Рис. 6. Изображение наилучшего (и единственного) блока.
Можно сделать вывод, что данные последовательности однозначно негомологичны, так как они содержат настолько мало значимых позиций, что даже крайне трудно выделить блоки.