Лого
corner   corner
 
   

Практикум 5. Парное выравнивание белков

Файл с практикумом: Eliseev_pr5.docx

Сравнение матриц аминокислотных замен

Матрица весов BLOSUM62 создана с помощью базы данных BLOCKS. С помощью этой матрицы можно определить вес выравнивания цитоплазматических белков. 62 есть порог кластеризации, процент, по достижении которого исследуемые последовательности начинают считаться одинаковыми.

Матрица же весов PHAT была разработана для трансмембранных белков, так как встречаемость аминокислот у них отличается от встречаемости в цитоплазматических белках.

Мною была построена еще одна матрица BLOSUM. В ходе создания использовались обновленные данные базы BLOCKS.

blosum.xlsx - ссылка для скачивания таблицы.

Таблица N1. Матрица BLOSUM для цитоплазматических белков, построенная вручную по обновленным данным базы BLOCKS.

BLOSUM

Таблица N2. Сравнение значений матриц весов замен для треонина. Сходные по свойствам аминокислоты выделены одинаковым цветом.

treonintreo

PHAT_T75_B73 построен с большей кластеризацией (75%), чем BLOSUM62 (62%). Также эти матрицы предназначены для разных белков. Как уже сказано ранее, PHAT создавали для трансмембранных, а BLOSUM - для цитоплазматических белков.

В матрице PHAT_T75_B73 при замене треонина на аминокислоту из других функциональных групп появляются большие штрафы, в отличие от других двух матриц. Хотя сказывается это в основном только на заряженных и ароматических (к примеру, замена треонина на триптофан или на аспарагиновую кислоту в матрице PHAT_T75_B73 сопровождается значительными штрафами, в отличие от матрицы BLOSUM62 и моей.).

При этои стоит заметить, что в любой из таблиц замена теонина на треонин сопровождается "бонусом", хотя в матрице PHAT_T75_B73 "бонус" меньше.

Замена треонина на серин тоже сопровождается "бонусом", но меньшим.

Треонин является гидрофильной аминокислотой. А в трансмембранных белках замена гидрофобной аминокислоты на гидрофильную может быть критичной для всего белка.

Сравнение выравниваний, полученных для коротких мутантов вручную и построенных классическими алгоритмами Нидлмана-Вунша и Смита-Ватермана

В пакете EMBOSS команда needle использует алгоритм Нидлмана-Вунша для осуществления глобального выравнивания. Команда же water использует алгоритм Смита-Ватермана для осуществления локального выравнивания. Глобальное выравнивание применяется больше к похожим последовательностям, а локальное - к преимущественно отличающимся друг от друга.

В качестве стандартных программы использовали следующие данные:

Matrix (матрица весов): EBLOSUM62
Gap_penalty (штраф за гэп): 10.0
Extend_penalty (штраф за продолжение гэпа): 0.5

Мутант N1
Способ выравнивания Вручную Needle Water
Процент идентичности 8/20 (40%); 8/193 (4.1%) 12/193 (6.2%) 6/12 (50.0%); 6/193 (3.1%)
Процент сходства 12/20 (60%); 12/193 (6.2%) 16/193 (8.3%) 8/12 (66.7%); 8/193 (4.1%)
Вес по матрице BLOSUM62 36 37 38

mutant_n1
Needle
SCO1_BACSU         1 MKVIKGLTAGLIFLFLCACGGQQIKDPLNYEVEPFTFQNQDGKNVSLESL     50
                                                                       
                   0 --------------------------------------------------      0

SCO1_BACSU        51 KGEVWLADFIFTNCETICPPMTAHMTDLQKKLKAENIDVRIISFSVDPEN    100
                                                                       
                   0 --------------------------------------------------      0

SCO1_BACSU       101 DKPKQLKKFAANYPLSFDNWDFLTGYSQSEIEEFALKSFKAIVKKPEGED    150
                               |.|.:.||:|.|                         || 
                   1 ----------AGYVILFDSWKF-------------------------GE-     14

SCO1_BACSU       151 QVIHQSSFYLVGPDGKVLKDYNGVENTPYDDIISDVKSASTLK    193
                     ||::||                                     
                  15 QVMNQS-------------------------------------     20

Water
SCO1_BACSU       111 ANYPLSFDNWDF    122
                     |.|.:.||:|.|
                   1 AGYVILFDSWKF     12

Вес выравнивания, сделанного вручную, меньше, чем вес, сделанный программой needle, а также программой water. Процент идентичности и сходства больше всего у выравнивания, сделанного needle, а меньше - у выравнивания сделанного water.

Мутант N2
Способ выравнивания Вручную Needle Water
Процент идентичности 8/20 (40%); 8/193 (4,1%) 7/193 (3.6%) 7/16 (43.8%); 7/193 (3.6%)
Процент сходства 10/20 (50%); 10/193 (5.1%) 9/193 (4.7%) 9/16 (56.2%); 9/193 (4.7%)
Вес по матрице BLOSUM62 20 24 31

mutant_n1
Needle
SCO1_BACSU         1 MKVIKGLTAGLIFLFLCACGGQQIKDPLNYEVEPFTFQNQDGKNVSLESL     50
                                                                       
                   0 --------------------------------------------------      0

SCO1_BACSU        51 KGEVWLADFIFTNCETICPPMTAHMTDLQKKLKAENIDVRIISFSVDPEN    100
                                                                   ...|
                   1 ----------------------------------------------YMTN      4

SCO1_BACSU       101 DKPKQLKKFAANYPLSFDNWDFLTGYSQSEIEEFALKSFKAIVKKPEGED    150
                     .|.:..|:.|.|.||.                                  
                   5 MKDQSFKEMAINDPLP----------------------------------     20

SCO1_BACSU       151 QVIHQSSFYLVGPDGKVLKDYNGVENTPYDDIISDVKSASTLK    193
                                                                
                  20 -------------------------------------------     20

Water
SCO1_BACSU       100 NDKPKQLKKFAANYPL    115
                     |.|.:..|:.|.|.||
                   4 NMKDQSFKEMAINDPL     19

Здесь и needle, и water получили одинаковые проценты идентичности и сходства. При это проценты идентичности и сходства больше у выравнивания, сделанного вручную.

Мутант N3
Способ выравнивания Вручную Needle Water
Процент идентичности 12/20 (60%); 12/193 (6.2%) 12/194 (6.2%) 10/16 (62.5%); 10/193 (5.1%)
Процент сходства 12/20 (60%); 12/193 (6.2%) 12/194 (6.2%) 10/16 (62.5%); 10/193 (5.1%)
Вес по матрице BLOSUM62 53 47 47

mutant_n1
Needle
SCO1_BACSU         1 MKVIKGLTAGLIFLFLCACGGQQIKDPLNYEVEPFTFQNQDGKNVSLESL     50
                                                                       
                   0 --------------------------------------------------      0

SCO1_BACSU        51 KGEVWLADFIFTN-CETICPPMTAHMTDLQKKLKAENIDVRIISFSVDPE     99
                                || .||.||...|.|.||||                   
                   1 -----------TNKTETTCPERQAVMLDLQK-------------------     20

SCO1_BACSU       100 NDKPKQLKKFAANYPLSFDNWDFLTGYSQSEIEEFALKSFKAIVKKPEGE    149
                                                                       
                  20 --------------------------------------------------     20

SCO1_BACSU       150 DQVIHQSSFYLVGPDGKVLKDYNGVENTPYDDIISDVKSASTLK    193
                                                                 
                  20 --------------------------------------------     20

Water
SCO1_BACSU        65 ETICPPMTAHMTDLQK     80
                     ||.||...|.|.||||
                   5 ETTCPERQAVMLDLQK     20
   
corner   corner
 


© Елисеев Алексей, 2012. Дата поселеднего изменения: 16.09.13