Карта локального сходства полипротеинов вируса полиомиелита(штамм Mahoney) и вируса ящура

Изображение 1:Карта локального сходства полипротеинов вируса полиомиелита(штамм Mahoney) и вируса ящура.

Таблица 1:Характеристика двух локальных выравниваний полипротеинов вируса полиомиелита(штамм Mahoney) и вируса ящура,имеющих максисальный вес.

Координаты участка в белке вируса полиомелита(начало-конец) Координаты участка в белке вируса ящура(начало-конец) Длина участка в белке вируса полиомелита Длина участка в белке вируса ящура Score % Identity % Positives(Similarity) Gaps Названия зрелых белков вируса полиомиелита, к которым относится участок Названия зрелых белков вируса ящура, к которым относится участок

1594-2208

1680-2323

614

643

253 bits(646)

29 %

48 %

55

48 %

55

1010-1419

949-1379

409

430

158 bits(400)

30 %

44 %

73

48 %

55

Таблица 2:Названия зрелых белков, к которым относятся участки двух локальных выравниваний полипротеинов вируса полиомиелита(штамм Mahoney) и вируса ящура,имеющих максисальный вес.

# Участок полипротеина вируса полиомиелита Участок полипротеина вируса ящура
Координаты выравнивания(в полипротеине полиомиелита/в полипротеине ящура) Координаты белка(начало-конец) Название ,белка Координаты белка(начало-конец) Название белка

1594-2208/1680-2323

1748-2209

RNA-directed RNA polymerase./FTId=PRO_0000040090.

1859-2328

RNA-directed RNA polymerase 3D-POL.{ECO:0000255}./FTId=PRO_0000422516.

1010-1419/949-1379

1031-1127

Protein 2B. {ECO:0000255}./FTId=PRO_0000040085.

950-1103

Protein 2B. {ECO:0000255}./FTId=PRO_0000422509.

Сравнение веса выравнивания со случайным

Таблица 3:Сравнение выравнивания двухбелков со случайным (выравнивание первого белка со ста случайно перемешанными последовательностями второго).

ID_1 ID_2 Вес выравнивания Среднее арифметическое весов случайных выравниваний Вес выравнивания(в битах) Медиана весов случайных выравниваний Квадриль весов случайных выравниваний Р(Вероятность получить такой же или больший вес при выравнивании двух случайных последовательностей той же длины и состава)
Для предположительно гомологичных белков

FABI_ECOLI

FABI_BACSU

651.5

44.75

44.25

51

90.96

4.15*10-28

Для предположительно неродственных белков

FABI_ECOLI

ERA_BACSU

45.5

38.77

38

42.25

2.76

0.15

Из приведенных данных видно, что вес выравнивания гомологичных белков во много раз превосходит средний вес "случайного" выравнивания, напротив вес выравнивания неродственных белков почти такой же, как вес "случайного". Это в очередной раз подтверждает то, что гомологичные белки имеют близкую аминокислотную структуру, а неродственные белки очень сильно различаются по строению. Величина P, равная вероятности получить такое же или лучшее по весу выравнивание произвольных последовательностей, в первом случае(для гомологичных белков) очень мала, что опять же говорит о том, что сходства в структуре несут закономерный характер, та же величина во втором случае(для неродственных белков) значительно, более чем на 28 порядков, больше, что свидетельствует в пользу того, что сходства в структкре неродственных белков случайны.

Эффект смены параметров программы water:
1)При замене матрицы на BLOSUM90: увеличивается перепад значений. Вероятно эта шкала является более "контрастной", чем используемая нами обычно EBLOSUM60, то есть вес выравниваний для гомологичных последовательностей при переходе с BLOSUM60 на BLOSUM90 увеличивается(для FABI_ECOLI и FABI_BACSU вес выравнивания увеличился с 651.5 до 692.5), а для неродственных уменьшается(для FABI_ECOLI и ERA_BACSU он уменьшился почти на треть с 45.5 до 33). В общем можно сказать, что матрица EBLOSUM90 более "требовательна" чем EBLOSUM60
2)При замене матрицы на BLOSUM30: веса выравниваний пропорционально увеличиваются, например, вес выравнивания FABI_ECOLI и ERA_BACSU увеличился с 45.5 до 199, вес выравнивания FABI_ECOLI и FABI_BACSU вес выравнивания увеличился с 651.5 до 874.5. Так что данная матрица значительно менее "требовательна", чем BLOSUM60.
В итоге: матрица BLOSUM60 является наиболее универсальной, в то время как BLOSUM90позволяет лучше видеть различия в структуре и может быть использована для дифференциации близких по весу выравниваний. Шкала BLOSUM30 является наиболее общей из трех и удобна вероятно будет удобна для разделения больших групп выравниваний на подгруппы по весу.

Проверка формулы для перевода веса выравнивания в биты:
Для 1000 случайных выравниваний FABI_ECOLI c 1000 случайных перемешиваний FABI_BACSU: медиана весов=44, верхний квартиль весов=50,итоговый вес выравнивания FABI_ECOLI c FABI_BACSU в битах=102.25(при рассмотрении только 100 перемешиваний он был равен 90.96). P=1.66*10-31, то есть увеличивается вес и вероятностность того, что эти последовательности гомологичны. Можно предположить, что при увеличении количества случайных выраниваний увеличивается точность перевода. Для уровня верхней 1/8 формула дает вес в битах равный 2.75, что при небольшом приближении равно трем.

BLAST: поиск гомологов белка в банке

Таблица 4:Характеристика белка AKO92848.1 и его гомологов, найденных в банке данных Swiss-Prot с помощью BLAST.

ID AC Организм, у которого взят белок Длина белка

A0A0H4KWY7_9BACI

AKO92848.1

Bacillus endophyticus

377

HDAH_PSEAE

Q9HXM1.1

Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1)

380

HDAH_ALCSD

Q70I53.3

Alcaligenes sp. (strain DSM 11172) (Bordetella sp. (strain FB188))

369

Таблица 5: Основные свединия о выравниваниях белка попарно с его гомологами(выравнивания составлены с помоью BLAST).

AC гомолога Координаты участка выравнивания в исходном Координаты участка выравнивания в найденном белке Длина участка в исходном белке Длина участка в найденном белке Вес выравнивания % Identity % Positives(Similarity) Gaps Процент покрытия исходного белка выравниванием Expect

Q9HXM1.1

1-361

1-364

361

364

331 bits(848)

44 %

64 %

5

95 %

1*-110

Q70I53.3

6-362

4-362

357

359

295 bits(755)

41 %

61 %

6

94 %

9*-97

Весенний семестр 2018


© Болихова Анастасия 2018