Практикум 10. Матрицы аминокислотных замен. Карта локального сходства.


1. Карта локального сходства двух полипротеинов.

Характеристика двух лучших выравниваний полипротеинов вирусов полиомиелита (P03301) и ящура (P03306)

% Identities% PositivesLengthGapsScoreScore (bits)
I.2949P03301: 614 (27,8 %)
P03306: 643 (27,6 %)
59 (8 %)644252
II.3751P03301: 276 (12,5 %)
P03306: 262 (11,2 %)
26 (9 %)398157


Карта локального сходства

Рисунок 1. Карта локального сходства белков P03301 и P03306.



Названия зрелых белков

Номер выравниванияКоординаты участка белкаНазвания зрелых белков
I.P03301: 1594 - 2208Protein 3CD
I.P03306: 1684 - 2327Picornain 3C (1650 - 1862)
RNA-directed RNApolymerase
3D-POL (1863 - 2332)
II.P03301: 1143 - 1419Protein 2C
II.P03306: 1121 - 1383Protein 2C


2. Сравнение веса выравнивания со случайным.



ID белковВес,
который выдает
программа water
Медиана весов
случайных выравниваний
Верхний квартильВес в битахp-значение
DACB_ECOLI и DACB_BACSU53.047.052.52.0910.24
PURK_ECOLI и FADH_BACSU34.539.7545.250.0460.97


В практикуме 9 характеристики оптимальных локальных выравниваний этих двух пар белков мне казались очень похожими, но p-значение показало, что эти выравнивания принципиально различаются. Конечно, DACB_ECOLI и DACB_BACSU – не самые хорошо выравнивающиеся гомологи, но 0,24 – приемлемая для гомологов величина, относительно числа 0.97.



2a. Эффект смены параметров.


ID белковВес,
который выдает
программа water
Медиана весов
случайных выравниваний
Верхний квартильВес в битахp-значение
DACB_ECOLI и DACB_BACSU53.033.035.0114.88e-4
PURK_ECOLI и FADH_BACSU34.531.034.02.170.22


Данные результаты получены при “Gap extension penalty" = 4 и с использованием матрицы аминокислотных замен EBLOSUM90. При таком изменении параметров p-значение для пар гомологичных и негомологичных белков сильно изменилось. Вероятность того, что выравнивание перемешанных последовательностей той же длины для негомологов будет иметь такой же вес и выше оказалась всего 0.22, то есть при данных параметрах совпадения в выравнивании признаются не случайными. Это кажется неправдоподобным.



2b. Проверка формулы для перевода в биты.


ID белковВес,
который выдает
программа water
Медиана весов
случайных выравниваний
Верхний квартиль1/8Вес в битахp-значение
DACB_ECOLI и DACB_BACSU53.045.551.555.752.710.15
PURK_ECOLI и FADH_BACSU34.539.544.7550.030.125



Действительно работает



3. BLAST: поиск гомологов в банке.


НаходкаIDACOrganism% Identities% PositivesGapsScoreScore (bits)ExpectCoverage
I.SUBT_BACAMP00782.1Bacillus amyloliquefaciens9899019307480.0ALV04273.1: 100%
P00782.1: 100%
II.SUBN_BACNAP35835.1Bacillus subtilis subsp. natto86921 (0 %)17136640.0ALV04273.1: 100%
P35835.1: 100%



© Belousova Evgenia, 2017