Селифонов (slfn) учебный сайт; Обо мне

Сравнение эволюционных взаимосвязей между разными эндонуклеазами рестрикции и метилтрансферазами систем РМ 2 классов.

Целью данной работы является сравнение эволюционных взаимосвязей между разными эндонуклеазами рестрикции (далее - ЭР) и метилтрансферазами (МТазами) систем рестрикции-модификации (Р-М) двух классов: RE_AlwI / DNA_methylase x2 и HNH_2, RE_AlwI / DNA_methylase x2. Для исследуемых систем характерно наличие рестриктазы с доменом RE_AlwI и двух МТаз с доменом DNA_methylase.

Построение выравниваний и филогенетических деревьев.

Имена исследуемых белков в Rebase были получены из файла extended-AlwI.xlsx (лист all-AlwI-proteins). Для этого была написана программа на языке python:

программа

Ссылка на программу в Google Colab.

Перед запуском программы нужный лист книги был сохранен в виде текстовой таблицы в формате tsv (также я развернул строки исходной таблицы с 651 по 1966, чтобы на выходе получить метилтрансферазы). Результат работы программы был проверен с помощью функции электронных таблиц "Найти и выделить". По запросу "DNA_methylase x2" программа нашла в таблице 15 строк, из которых 5 соответствуют ЭР, и 10 - МТазам. Таким образом, были найдены 5 систем Р-М: Cpa18696ORFHP, Gme92ORFJ1P и OspMM35ORF13180P из класса HNH_2, RE_AlwI / DNA_methylase x2, а также Mbo10118ORF265P и Mbo1412ORF456P, принадлежащие классу RE_AlwI / DNA_methylase x2.

Ни для одного из найденных имен нет связи с Uniprot ID. Так как в Jalview нет возможности запросить последовательности из Rebase, их пришлось искать в этой базе данных вручную. В итоге были составлены 2 файла в формате fasta, содержащие соответственно все последовательности ЭР (5) и все последовательности МТаз (10). С помощью программы Jalview были созданы 2 множественных выравнивания (алгаритм Muscle with defaults) и 2 филогенетических дерева (метод Average distance с использованием матрицы весов BLOSUM62 для вычисления расстояний). В выравнивании шести первых аминокислотных остатков последовательности ЭР Mbo10118ORF265P программа допустила ошибку, которая была исправлена вручную. Сохраненные проекты Jalview доступны для скачивания ниже (в каждом открыты 2 окна: дерево и выравнивание).

Ссылка на скачивание дерева и выравнивания ЭР.

Ссылка на скачивание лерева и выравнивания МТаз.

Сравнение и описание филогенетических деревьев

1
2
Рис. 1. Филогенетические деревья ЭР (сверху) и МТаз (снизу).

Сравним филогенетические деревья, отражающие ход эволюции метилтрансфераз и эндонуклеаз рестрикции систем рестрикции-модификации исследуемых классов (Рис. 1).

Если рассчитать средние длины последовательностей (328.2 для МТаз и 443.6 для рестриктаз) и разницу между ними (115.4, 35.16% от меньшей длины), то можно заметить, что она почти совпадает с разницей между длинами ветвей двух деревьев от "корня" до "верхушки" (382.36 условных единиц, 34.7% от меньшего числа). Соответственно, согласно построенному дереву в первом приближении изменения накапливались в последовательностях МТаз и ЭР с примерно одинаковой скоростью.

На первый взгляд, сравниваемые деревья отличаются последовательностью ветвления. Однако примененный для их построения метод использует допущение, согласно которому скорость эволюции в каждой из ветвей (а соответственно, и длина каждой из них от корня до верхушки) одинакова. При этом деревья приобретают единый план строения, если изменить место укоренения. С наименьшими потерями в 56.69 единиц веса (в обе стороны, для каждой из изменяемых ветвей) это можно сделать, переместив корень филогенетического дерева МТаз в отмеченную на рисунке точку (Рис. 1, красный кружок). Таким образом, вероятнее всего, дерево для ЭР лучше описывает ход эволюции исследуемых систем Р-М. С учетом этой поправки все отличия сводятся к произошедшей дупликации гена МТазы.

В совокупности полученные деревья отражают последовательность событий в эволюции пяти рассматриваемых систем рестрикции-модификации. Отдельную группу составляют системы Mbo10118ORF265P и Mbo1412ORF456P, принадлежащие классу RE_AlwI / DNA_methylase x2. В этой ветви появление копии гена метилтрансферазы (Рис. 1, цифра 1, с учетом поправки) произошло у их общего предка независимо от остальных трех систем Р-М, причем вторая МТаза первой системы (M2.Mbo10118ORF265P) родственна первой МТазе второй системы, и наоборот. Другую группу составляют оставшиеся три системы Р-М: Cpa18696ORFHP, Gme92ORFJ1P и OspMM35ORF13180P. Все они входят в класс HNH_2, RE_AlwI / DNA_methylase x2. У их общего предка также произошла дупликация гена МТазы (Рис. 1, цифра 2). Белки первой из перечисленных систем на соответствующих деревьях занимают более базальное положение.

Стоит отметить, что последовательности ЭР из разных групп выравнялись достаточно плохо, поэтому для подтверждения или опровержения выравнивания между группами необходимы дальнейшие исследования.