Практикум 5. Парное выравнивание белков
Файл с практикумом: Eliseev_pr5.docx
Сравнение матриц аминокислотных замен
Матрица весов BLOSUM62 создана с помощью базы данных BLOCKS. С помощью этой матрицы можно определить вес выравнивания цитоплазматических белков.
62 есть порог кластеризации, процент, по достижении которого исследуемые последовательности начинают считаться одинаковыми.
Матрица же весов PHAT была разработана для трансмембранных белков, так как встречаемость аминокислот у них отличается от встречаемости в цитоплазматических белках.
Мною была построена еще одна матрица BLOSUM. В ходе создания использовались обновленные данные базы BLOCKS.
blosum.xlsx - ссылка для скачивания таблицы.
Таблица N1. Матрица BLOSUM для цитоплазматических белков,
построенная вручную по обновленным данным базы BLOCKS.
Таблица N2. Сравнение значений матриц весов замен для треонина. Сходные по свойствам аминокислоты
выделены одинаковым цветом.
PHAT_T75_B73 построен с большей кластеризацией (75%), чем BLOSUM62 (62%). Также эти матрицы предназначены для разных белков. Как уже сказано ранее, PHAT создавали для трансмембранных,
а BLOSUM - для цитоплазматических белков.
В матрице PHAT_T75_B73 при замене треонина на аминокислоту из других функциональных групп появляются большие штрафы, в отличие от других двух матриц. Хотя сказывается это в основном только на
заряженных и ароматических (к примеру, замена треонина на триптофан или на аспарагиновую кислоту в матрице
PHAT_T75_B73 сопровождается значительными штрафами, в отличие от матрицы BLOSUM62 и моей.).
При этои стоит заметить, что в любой из таблиц замена теонина на треонин сопровождается "бонусом", хотя в матрице
PHAT_T75_B73 "бонус" меньше.
Замена треонина на серин тоже сопровождается "бонусом", но меньшим.
Треонин является гидрофильной аминокислотой. А в трансмембранных белках замена гидрофобной аминокислоты на гидрофильную
может быть критичной для всего белка.
Сравнение выравниваний, полученных для коротких мутантов вручную и построенных классическими
алгоритмами Нидлмана-Вунша и Смита-Ватермана
В пакете EMBOSS команда needle использует алгоритм Нидлмана-Вунша для осуществления глобального выравнивания. Команда же
water использует алгоритм Смита-Ватермана для осуществления локального выравнивания. Глобальное выравнивание применяется больше к похожим последовательностям,
а локальное - к преимущественно отличающимся друг от друга.
В качестве стандартных программы использовали следующие данные:
Matrix (матрица весов): EBLOSUM62
Gap_penalty (штраф за гэп): 10.0
Extend_penalty (штраф за продолжение гэпа): 0.5
Мутант N1
Способ выравнивания |
Вручную |
Needle |
Water |
Процент идентичности |
8/20 (40%); 8/193 (4.1%) |
12/193 (6.2%) |
6/12 (50.0%); 6/193 (3.1%) |
Процент сходства |
12/20 (60%); 12/193 (6.2%) |
16/193 (8.3%) |
8/12 (66.7%); 8/193 (4.1%) |
Вес по матрице BLOSUM62 |
36 |
37 |
38 |
Needle
SCO1_BACSU 1 MKVIKGLTAGLIFLFLCACGGQQIKDPLNYEVEPFTFQNQDGKNVSLESL 50
0 -------------------------------------------------- 0
SCO1_BACSU 51 KGEVWLADFIFTNCETICPPMTAHMTDLQKKLKAENIDVRIISFSVDPEN 100
0 -------------------------------------------------- 0
SCO1_BACSU 101 DKPKQLKKFAANYPLSFDNWDFLTGYSQSEIEEFALKSFKAIVKKPEGED 150
|.|.:.||:|.| ||
1 ----------AGYVILFDSWKF-------------------------GE- 14
SCO1_BACSU 151 QVIHQSSFYLVGPDGKVLKDYNGVENTPYDDIISDVKSASTLK 193
||::||
15 QVMNQS------------------------------------- 20
Water
SCO1_BACSU 111 ANYPLSFDNWDF 122
|.|.:.||:|.|
1 AGYVILFDSWKF 12
Вес выравнивания, сделанного вручную, меньше, чем вес, сделанный программой needle, а также программой water.
Процент идентичности и сходства больше всего у выравнивания, сделанного needle, а меньше - у выравнивания сделанного water.
Мутант N2
Способ выравнивания |
Вручную |
Needle |
Water |
Процент идентичности |
8/20 (40%); 8/193 (4,1%) |
7/193 (3.6%) |
7/16 (43.8%); 7/193 (3.6%) |
Процент сходства |
10/20 (50%); 10/193 (5.1%) |
9/193 (4.7%) |
9/16 (56.2%); 9/193 (4.7%) |
Вес по матрице BLOSUM62 |
20 |
24 |
31 |
Needle
SCO1_BACSU 1 MKVIKGLTAGLIFLFLCACGGQQIKDPLNYEVEPFTFQNQDGKNVSLESL 50
0 -------------------------------------------------- 0
SCO1_BACSU 51 KGEVWLADFIFTNCETICPPMTAHMTDLQKKLKAENIDVRIISFSVDPEN 100
...|
1 ----------------------------------------------YMTN 4
SCO1_BACSU 101 DKPKQLKKFAANYPLSFDNWDFLTGYSQSEIEEFALKSFKAIVKKPEGED 150
.|.:..|:.|.|.||.
5 MKDQSFKEMAINDPLP---------------------------------- 20
SCO1_BACSU 151 QVIHQSSFYLVGPDGKVLKDYNGVENTPYDDIISDVKSASTLK 193
20 ------------------------------------------- 20
Water
SCO1_BACSU 100 NDKPKQLKKFAANYPL 115
|.|.:..|:.|.|.||
4 NMKDQSFKEMAINDPL 19
Здесь и needle, и water получили одинаковые проценты идентичности и сходства. При это проценты идентичности и сходства больше у выравнивания, сделанного вручную.
Мутант N3
Способ выравнивания |
Вручную |
Needle |
Water |
Процент идентичности |
12/20 (60%); 12/193 (6.2%) |
12/194 (6.2%) |
10/16 (62.5%); 10/193 (5.1%) |
Процент сходства |
12/20 (60%); 12/193 (6.2%) |
12/194 (6.2%) |
10/16 (62.5%); 10/193 (5.1%) |
Вес по матрице BLOSUM62 |
53 |
47 |
47 |
Needle
SCO1_BACSU 1 MKVIKGLTAGLIFLFLCACGGQQIKDPLNYEVEPFTFQNQDGKNVSLESL 50
0 -------------------------------------------------- 0
SCO1_BACSU 51 KGEVWLADFIFTN-CETICPPMTAHMTDLQKKLKAENIDVRIISFSVDPE 99
|| .||.||...|.|.||||
1 -----------TNKTETTCPERQAVMLDLQK------------------- 20
SCO1_BACSU 100 NDKPKQLKKFAANYPLSFDNWDFLTGYSQSEIEEFALKSFKAIVKKPEGE 149
20 -------------------------------------------------- 20
SCO1_BACSU 150 DQVIHQSSFYLVGPDGKVLKDYNGVENTPYDDIISDVKSASTLK 193
20 -------------------------------------------- 20
Water
SCO1_BACSU 65 ETICPPMTAHMTDLQK 80
||.||...|.|.||||
5 ETTCPERQAVMLDLQK 20
|