Изображение 1:Карта локального сходства полипротеинов вируса полиомиелита(штамм Mahoney) и вируса ящура.
Таблица 1:Характеристика двух локальных выравниваний полипротеинов вируса полиомиелита(штамм Mahoney) и вируса ящура,имеющих максисальный вес.
Координаты участка в белке вируса полиомелита(начало-конец) | Координаты участка в белке вируса ящура(начало-конец) | Длина участка в белке вируса полиомелита | Длина участка в белке вируса ящура | Score | % Identity | % Positives(Similarity) | Gaps | Названия зрелых белков вируса полиомиелита, к которым относится участок | Названия зрелых белков вируса ящура, к которым относится участок |
1594-2208 |
1680-2323 |
614 |
643 |
253 bits(646) |
29 % |
48 % |
55 |
48 % |
55 |
1010-1419 |
949-1379 |
409 |
430 |
158 bits(400) |
30 % |
44 % |
73 |
48 % |
55 |
Таблица 2:Названия зрелых белков, к которым относятся участки двух локальных выравниваний полипротеинов вируса полиомиелита(штамм Mahoney) и вируса ящура,имеющих максисальный вес.
# | Участок полипротеина вируса полиомиелита | Участок полипротеина вируса ящура | ||
Координаты выравнивания(в полипротеине полиомиелита/в полипротеине ящура) | Координаты белка(начало-конец) | Название ,белка | Координаты белка(начало-конец) | Название белка |
1594-2208/1680-2323 |
1748-2209 |
RNA-directed RNA polymerase./FTId=PRO_0000040090. |
1859-2328 |
RNA-directed RNA polymerase 3D-POL.{ECO:0000255}./FTId=PRO_0000422516. |
1010-1419/949-1379 |
1031-1127 |
Protein 2B. {ECO:0000255}./FTId=PRO_0000040085. |
950-1103 |
Protein 2B. {ECO:0000255}./FTId=PRO_0000422509. |
Таблица 3:Сравнение выравнивания двухбелков со случайным (выравнивание первого белка со ста случайно перемешанными последовательностями второго).
ID_1 | ID_2 | Вес выравнивания | Среднее арифметическое весов случайных выравниваний | Вес выравнивания(в битах) | Медиана весов случайных выравниваний | Квадриль весов случайных выравниваний | Р(Вероятность получить такой же или больший вес при выравнивании двух случайных последовательностей той же длины и состава) |
Для предположительно гомологичных белков | |||||||
FABI_ECOLI |
FABI_BACSU |
651.5 |
44.75 |
44.25 |
51 |
90.96 |
4.15*10-28 |
Для предположительно неродственных белков | |||||||
FABI_ECOLI |
ERA_BACSU |
45.5 |
38.77 |
38 |
42.25 |
2.76 |
0.15 |
Из приведенных данных видно, что вес выравнивания гомологичных белков во много раз превосходит средний вес "случайного" выравнивания, напротив вес выравнивания неродственных белков почти такой же, как вес "случайного". Это в очередной раз подтверждает то, что гомологичные белки имеют близкую аминокислотную структуру, а неродственные белки очень сильно различаются по строению. Величина P, равная вероятности получить такое же или лучшее по весу выравнивание произвольных последовательностей, в первом случае(для гомологичных белков) очень мала, что опять же говорит о том, что сходства в структуре несут закономерный характер, та же величина во втором случае(для неродственных белков) значительно, более чем на 28 порядков, больше, что свидетельствует в пользу того, что сходства в структкре неродственных белков случайны.
Эффект смены параметров программы water:
1)При замене матрицы на BLOSUM90: увеличивается перепад значений.
Вероятно эта шкала является более "контрастной", чем используемая нами обычно EBLOSUM60, то есть вес выравниваний для
гомологичных последовательностей при переходе с BLOSUM60 на BLOSUM90 увеличивается(для FABI_ECOLI и FABI_BACSU
вес выравнивания увеличился с 651.5 до 692.5), а для неродственных уменьшается(для FABI_ECOLI и
ERA_BACSU он уменьшился почти на треть с 45.5 до 33). В общем можно сказать, что матрица EBLOSUM90 более "требовательна" чем EBLOSUM60
2)При замене матрицы на BLOSUM30: веса выравниваний пропорционально увеличиваются, например, вес выравнивания
FABI_ECOLI и ERA_BACSU увеличился с 45.5 до 199, вес выравнивания FABI_ECOLI и FABI_BACSU
вес выравнивания увеличился с 651.5 до 874.5. Так что данная матрица значительно менее "требовательна", чем BLOSUM60.
В итоге: матрица BLOSUM60 является наиболее универсальной, в то время как BLOSUM90позволяет лучше видеть различия в
структуре и может быть использована для дифференциации близких по весу выравниваний. Шкала BLOSUM30 является наиболее
общей из трех и удобна вероятно будет удобна для разделения больших групп выравниваний на подгруппы по весу.
Проверка формулы для перевода веса выравнивания в биты:
Для 1000 случайных выравниваний FABI_ECOLI c 1000 случайных перемешиваний FABI_BACSU: медиана весов=44, верхний квартиль весов=50,итоговый вес выравнивания
FABI_ECOLI c FABI_BACSU в битах=102.25(при рассмотрении только 100 перемешиваний он был равен 90.96). P=1.66*10-31, то есть
увеличивается вес и вероятностность того, что эти последовательности гомологичны. Можно предположить, что при увеличении количества случайных выраниваний
увеличивается точность перевода. Для уровня верхней 1/8 формула дает вес в битах равный 2.75, что при небольшом приближении равно трем.
Таблица 4:Характеристика белка AKO92848.1 и его гомологов, найденных в банке данных Swiss-Prot с помощью BLAST.
ID | AC | Организм, у которого взят белок | Длина белка |
A0A0H4KWY7_9BACI |
AKO92848.1 |
Bacillus endophyticus |
377 |
HDAH_PSEAE |
Q9HXM1.1 |
Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) |
380 |
HDAH_ALCSD |
Q70I53.3 |
Alcaligenes sp. (strain DSM 11172) (Bordetella sp. (strain FB188)) |
369 |
Таблица 5: Основные свединия о выравниваниях белка попарно с его гомологами(выравнивания составлены с помоью BLAST).
AC гомолога | Координаты участка выравнивания в исходном | Координаты участка выравнивания в найденном белке | Длина участка в исходном белке | Длина участка в найденном белке | Вес выравнивания | % Identity | % Positives(Similarity) | Gaps | Процент покрытия исходного белка выравниванием | Expect |
Q9HXM1.1 |
1-361 |
1-364 |
361 |
364 |
331 bits(848) |
44 % |
64 % |
5 |
95 % |
1*-110 |
Q70I53.3 |
6-362 |
4-362 |
357 |
359 |
295 bits(755) |
41 % |
61 % |
6 |
94 % |
9*-97 |
Весенний семестр 2018