Матрицы аминокислотных замен


На страницу 2-го семестра
1.Весы замен аминокислот взяты из матрицы Blosum 62. Средний вес аминокислотных замен среди первой группы = 0, среди второй группы = 0,5, а между группами =-0,8125. Это значит, что замена аминокислот внутри группы более вероятна. Это и понятно — внутри группы находятся аминокислоты со схожими свойствами. Такая замена не будет очень сильно влиять на структуру белка, значит велика вероятность сохранения функции, а значит выживания организма и передачи гена потомкам.
Вычисления в файле blosum62.xls
2.Вес замены аминокислот в парах AA, AD, AC были посчитаны по формуле: частота встречаемости пары/(частота встречаемости первой аминокислоты*частота встречаемости второй аминокислоты). Для вычисления этих величин был выбран блок выровненных последовательностей белка DKGA и его гомологов шириной 55 аминокислот, состоящий из 1069 последовательностей. Расчет количества пар был произведен программой pairs_count.exe, а расчет частоты встречаемости пары и собственно веса замены находится в файле block_pairs.xls. При расчете веса использовались частоты аминокислот, расчитанные для данного блока в файле block.xls.
3.Аналогично рассчитанные весы замен для тех же пар, но для большей выборки (200 блоков) приведены в файле blocks_200_pairs.xls.
По сравнению с матрицей Blosum62:
Пара Рассчитанные значения для 1 блока Рассчитанные значения для 200 блоков Значения из матрицы
AA 2,6 3,8 4
AD 2,0 0,7 -2
AC 3,5 1,0 0

Столь сильное расхождение можно объяснить ограниченностью данных для анализа - использовался всего 1 или 200 блоков. (Основание логарифма=2 - то же, что и в Blossum62, коэффициент также равен 2). Но на фоне этих расхождений можно заметить значительное сходство (причём для 200 блоков гораздо больше, чем для одного: больше данных - точнее результаты). По всем трём данным вес замены A на D - наименьший. С 200 блоками ещё лучше: вес, как и в BLOSSUM62, постепенно уменьшается в ряду AA-AC-AD, причем разница с матрицей BLOSUM62 уменьшается.

© Моросанова Мария