Матрицы весов аминокислотных замен
Целью занятия было научиться работать с выравниваниями аминокислотных последовательностей белков, описывающих их гомологичное и филогенетическое сродство. Результатом работы над этим практикумом является файл
blosum62.xls.
Изучение матрицы BLOSUM62
В качестве исходных данных при составлении таблиц BLOSUM используются частоты аминокислотных замен одних аминокислот на другие. Замтем вычисляется частота такой замены: число замен делится на общее количество аминокислот. Для каждой аминокислоты вычисляется доля замен с её участием среди всех замен: суммируются доли её замен с другими аминокислотами (пополам) и доля её замен саму на себя берётся без уполовинивания. Для вычисления веса замены, например, A на G берётся частота соответственной замены и делится на произведение долей замен соответственных аминокислот; для оперирования с этими числами от них берётся удвоенный логарифм, которые и были здесь сравнены.
Таблица 1 Средний вес замен внутри одной, второй группы и двух разных.
|
|
A
|
G
|
S
|
T
|
|
|
A
|
4
|
0
|
1
|
0
|
|
|
G
|
0
|
6
|
0
|
-2
|
|
|
S
|
1
|
0
|
4
|
1
|
|
|
T
|
0
|
-2
|
1
|
5
|
|
|
Среднее
|
1,90
|
|
|
N
|
D
|
E
|
Q
|
|
|
A
|
-2
|
-2
|
-1
|
-1
|
|
|
G
|
0
|
-1
|
-2
|
-2
|
|
|
S
|
1
|
0
|
0
|
0
|
|
|
T
|
0
|
-1
|
-1
|
-1
|
|
|
Среднее
|
-0,81
|
|
|
N
|
D
|
E
|
Q
|
|
|
N
|
6
|
1
|
0
|
0
|
|
|
D
|
1
|
6
|
2
|
0
|
|
|
E
|
0
|
2
|
5
|
2
|
|
|
Q
|
0
|
0
|
2
|
5
|
|
|
Среднее
|
2,70
|
Вычисление весов замен аминокислот на основе одного "блока".
Из базы данных BLOCKS был выбран блок
IPB002491. С помощью программы
pairs_count.exe был произведен подсчет количества замен соответствующих аминокислотных остатков в данном блоке (в качестве максимального процента идентичности, используемого при кластеризации, было выбрано число 62), результат - в файле
block_pairs.txt.
Вычисление весов замен аминокислот на основе большой выборки блоков.
Попытка воспользоваться файлом
blocks_200.dat аналогичным образом привела к печальному сообщению:
Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 1
at alg.Stat.main(Stat.java:96)
Так что выполнить второе задание мне не удалось. Обидно, что из-за глюков данной программы снимаются баллы.