Практикум 11. |
Задание 1. |
Отличие глобального выравнивания от локального в том, что последовательности должны быть гомологичны полностью, в то время как в локальном
гомологичны только домены и штрафов из-за различия последовательностей между ними нет. Для глобального выравнивания использовала команду needle, для
локального water. Параметры использовала по умолчанию: -gapopen - штраф за открытие гэпа 10.0, -gapextend - штраф за продолжение гэпа 0.5,
-endweigh - разрешение штрафовать концевые гэпы 10.0, -endextend - штраф за продолжение концевого гэпа 0.5, матрица весов EBLOSUM62 (для белковых послеовательностей).
Для того чтобы сохранить выравнивание
в формате fasta использовала команду -aformat3 fasta.
Использовала следующие белки:
- Шаперонный белок DnaK (DNAK_HALWD)
- Шаперонный белок DnaK (DNAK_MYCS2)
|
Рисунок 1. Глобальное выравнивание(сверху) и локальное выравнивание(снизу).
|
Таблица1. Сравнение глобального и локального выравниваний.
Выравнивание | Длина выравнивания | Гэп | Гэп, % | Identity abs | Identity percent | Similarity abs | Similarity percent | Число инделей | Вес выравнивания |
needle |
654 |
45 |
6,9% |
351 |
53,7% |
438 |
70,0% |
7 |
1730,5 |
water |
648 |
41 |
6,3% |
349 |
53,9% |
456 |
70,4% |
5 |
1732 |
Можно заметить что глобальное и локальное выравнивания отличаются незначительно,в локальном выравнивании немного меньше процент гэпов и длина, но
выше процент абсолютно и функционально консервативных позиций и вес выравнивания.
|
Задание 2.
Сравнивала свой белок - металло-бета-лактамаза подкласса B3(A0A109QC07_9BRAD, функция - ) с пятью следующими негомологичными белками:
- Предполагаемая ацил-CoA-синтетаза (тип формирования NDP) - Q82M39_STRAW
- Сиалидаза - A0A0B5QAX8_CLOBE
- АДФ-рибоза пирофосфатаза -A0A0X8D5E1_9BACL
- Селеноцистеин-специфический фактор удлинения трансляции -A0A1B1RYY2_9BACL
- Гамма-глутамилтранспептидаза - A8FC81_BACP2
Таблица2. Локальное выравнивание негомологичных белков.
Идентификатор белка | Длина выравнивания | Гэп | Гэп, % | Identity | Identity,% | Similarity | Similarity,% | Число инделей | Вес выравнивания |
Q82M39_STRAW |
335 |
102 |
30,4% |
60 |
17,9% |
112 |
33,4% |
16 |
53,0 |
A0A0B5QAX8_CLOBE |
329 |
126 |
38,3% |
62 |
18,8% |
100 |
30,4% |
14 |
53,5 |
A0A0X8D5E1_9BACL |
172 |
53 |
30,8% |
35 |
20,3% |
62 |
36,0% |
7 |
53,5 |
A0A1B1RYY2_9BACL |
356 |
105 |
29,5% |
72 |
20,2% |
127 |
35,7% |
18 |
52,5 |
A8FC81_BACP2 |
137 |
32 |
23,4% |
39 |
28,5% |
59 |
43,1% |
7 |
59,5 |
|
Рисунок 2. Сравнение выравнивания гомологичных (сверху) и негомологичных белков(снизу).
|
Можно заметить, что процент абсолютно консервативных и функционально консервативных позиций негомологичных белков значительно меньше, примерно 20 и 35 процентов соответственно
(у гомологичных 54 и 70). Также увеличивается число инделей(зависит от длины выравнивания, так для выравнивания длиной 330 - примерно 15, у гомологичных - для длины в 650 - 6 инделей) и процент гэпов (около 30 у негомолгичных и 6,5 у гомологичных).
Значительно меньше длина (330 - 170 против 650) и вес выравнивания (53 против 1730). |
Задание 3.
|
Рисунок 3. Выравнивание гомологичных белков несколькими программами (локальное, глобальное и T-coffee сверху вниз).
|
Как можно заметить, выравнивания практически идентичны. Отличия:
- Локальное обрезает концы с гэпами в начале и конце выравнивания - (1-4 позиции в двух других выравниваниях, аспарагин и лизин из второй последовательности - две последних аминокислоты).
Локальное выравнивание короче по длине.
- В выравнивании T-coffee стоит гэп напротив глутамата в позиции 78. В двух других напротив предыдущего глутамата. Также T-coffee ставит гэр по-другому
в 163 позиции. Аспартат(отрицательно заряжен) функционально не консервативен ни лизину(положительно заряжен) ни глицину(неполярный). Однозначно сказать какое выравнивание правильное нельзя.
Можно найти различия в расстановке гэпов в 330 позиции. Снова нельзя сказать какому из глицинов глицин гомологичен.
- Также программы по-разному выбирают, где поставить индели. Локальное и глобальное выравнивание - 528-535 позиции.562-565(укорочен за счет еще одного гэпа в 544, а также отсутствия гэпов в 564-565)
. На мой взгляд, более правильное выравнивание T-coffee. (Чем меньше инделей - тем лучше. T-coffeeукорачивает его и заменяет на 1).
Кроме того
- Также можно наблюдать различия в фенилаланине и гистидине, находящихся в позициях 607-608 в локальном выравнивании. С одной стороны,
одна большая делеция вероятнее двух, расположенных очень близко. Однако, гистидин встречается в "выпавшем" куске последовательности гомолога довольно часто
и можно решить, что он гомологичен какому-нибудь гистидину. Кроме того, фенилаланин довольно редкая аминокислота. Поэтому решить какое выравнивание верное затруднительно.
|