Выравнивания

Результаты выполнения практикума находятся в таблице (скачать). Для визуализации результатов использовалась программа Jalview. На изображениях присутсвует 5 строк:
1) выровненные последовательности
2) conservation: показывает сохранение физикохимических свойств последовательности и помечает абсолютно консервативные остатки (у них по умолчанию 11 баллов) жёлтой звёздочкой ('*'), консервативные (у них 10 баллов) - жёлтым плюсиком ('+'). Все остальные колонки тем темнее, чем ниже их степень консервативности.
3) quality: для оценки качества используется BLOSUM матрица, описывающая вероятность появления биологически значимой пары аминокислот/нуклеотидов в выравнивании
4) consensus: процент остатка в сайте ('+' обозначает неконсервативный остаток и '-' - гэп)
5) occupancy: количество гэпов

Для оценки вклада миссенс-мутаций использовалась программа Mu-pro[1], которая основана на методе опорных векторов и предсказывает ΔG. При помощи неё можно понять, увеличится или уменьшится стабильность белка в результате мутации (только для миссенс). Мною специально были выбраны миссенс-мутации, в результате которых происходит замена на аминокислоту с другими свойствами. Количество комбинаций и размера выборки недостаточно для того, чтобы сделать обоснованный вывод, но во всех рассмотренных случаях стабильность уменьшалась. Я хотела подобрать случай, когда при миссенс-мутации с заменой на аминокислоту с аналогичными свойствами стабильность увеличивается, но я такого найти не смогла.
Интуитивно повышение стабильности кажется чисто положительной тенденцией, однако чрезмерная стабильность ведёт к понижению активности из-за ограничения флуктуации и необходимой подвижности, нужной для катализа[2]. В то же время белки могут сохранять активность при потерях стабильности не более, чем 10 ккал/моль, что примерно равно энергии двух водородных связей[3].
В целом, на основе полученных результатов можно осторожно предположить, что миссенс-мутации, ведущие к повышению стабильности белка происходят реже, чем те, которые эту стабильность снижают.
Инсерции и делеции вносят большой вклад в генетическую вариабельность. Так, например, инделы перепредставлены в датабазах генетических заболеваний[4]. Объяснение этому стало очевидно при выполнении данного практикума: делеция или вставка не кратного трём числа нуклеотидов ведёт к сильному изменению последовательности белка, и, как можно предположить, в большинстве случаев к потере функции.
Места для инделов были выбраны в начале последовательности, так как было показано [5], что большая их часть возникает вследствие SSM (slipped strand mispairing).
Нонсенс-мутации приводят к укорочению белка. Я решила проверить, присутствует ли избегание кодонов, из которых может в результате одиночной замены получиться стоп-кодон. Для этого я сравнила содержание кодонов, которые при замене 1 нуклеотида могут стать стоп-кодонами (скачать барплот, одна колонка - количество кодонов, которые могут мутировать в данный кодон при одиночной миссенс-мутации). В пределах данного белка никакого избегания замечено не было (отрицательный результат тоже результат).

[1] J. Cheng, A. Randall, and P. Baldi. Prediction of Protein Stability Changes for Single-Site Mutations Using Support Vector Machines. Proteins, vol. 62, no. 4, pp. 1125-1132, 2006
[2] Leo C. James, Pietro Roversi, Dan S. Tawfik. Antibody Multispecificity Mediated by Conformational Diversity. Science, Vol. 299, Issue 5611, pp. 1362-1367, 2003
[3] Mark A. DePristo, Daniel M. Weinreich & Daniel L. Hartl. Missense meanderings in sequence space: a biophysical view of protein evolution. Nature Reviews Geneticsvolume 6, pages678–687, 2005
[4] Daniel G. MacArthur, Chris Tyler-Smith. Loss-of-function variants in the genomes of healthy humans. Human Molecular Genetics, Volume 19, Issue R2, Pages R125–R130, 2010
[5] Stephen B. Montgomery, David L. Goode, Erika Kvikstad. The origin, evolution, and functional impact of short insertion–deletion variants identified in 179 human genomes. Advance Genome Res. 2013