Биологическая задача этого блока состоит в подтверждении или опровержении гипотезы о том, что митохондрии эукариот произошли от альфапротеобактерий, а не от гаммапротеобактерий.
Выравнивание доменов было взято из Pfam с идентификатором PF00164, с помощью скрипта на bash в нем были оставлены только найденные в SRS последовательности. Колонки состоящие из одних гэпов удалялись. Выяснилось, что 5 из29-ти найденных последовательностей не присутствуют в выравнивании Pfam, хотя на странице SRS этих белков есть ссылка на страницу Pfam с идентификатором PF00164. Данные последовательности были удалены из общей выборки (4 из первых 25-ти последовательностей и 1 из выборки с 4-мя последовательностями).
С помощью программы muscle на сервере kodomo для оставшихся 24 последовательностей было построено множественное выравнивание, к которому затем были добавлены веса с помощью pwf из пакета PFTOOLs.
Сравнение полного выравнивания и выравнивания доменов показало, что они практически идентичны. Следовательно, полное выравнивание можно смело использовать для дальнейших целей.
Результаты поиска по двум группам бактерий с разными значениями порога
гаммапротеобактении | альфапротеобактерии | |||||
порог | всего | Онтология "клеточный компонент" | GO "малая субчастица рибосомы" | всего | Онтология "клеточный компонент" | GO "малая субчастица рибосомы" |
5.0 | 601 | 517 | 158 | 327 | 279 | 82 |
10.0 | 141 | 141 | 141 | 74 | 74 | 74 |
30.0 | 141 | 141 | 141 | 74 | 74 | 74 |
По результатам поиска было выбрано значение порога, равное 10.0, так как при этом пороговом значении все найденные белки как для альфапротеобактерий, так и для гаммапротеобактерий имели GO "малая субчастица рибосомы". Как видно, при таком пороге мы теряем 17 и 12 белков из гаммапротеобактерий и альфапротеобактерий соответственно, которые находятся при пороге, равном 5. Но при этом пороге много "лишних" белков; при порогах 6, 7, 8, 9 число находок с GO "малая субчастица рибосомы" становится равной таковому при поиске с порогом 10.0.
Ниже представлена гистограммыа распределения долей нормированных весов находок для
альфапротеобактерий и гаммапротеобактерий
Гистограмма была построена средствами Excel по результатам поиска по построенному выше профилю для альфа- и гаммапротеобактерий с порогом 10.
Из гистограммы распределения видно, что вес
наибольшего числа находок среди гаммапротеобактений меньше, нежели вес
наибольшей части находок среди альфапротеобактерий.
Наибольшим весом обладает последовательность из альфапротеобактерии
Maricaulis maris (AC - Q0ANP5)
Вилкоксон=1.301E4, Z=5.125, Значимость=0, степ.своб = 141,74 Гипотеза 1: <Есть различия между медианами выборок>
альфапротеобактерии
Среднее Медиана 54.35 55.81
гаммапротеобактерии
Среднее Медиана 54.28 54.43Как видно, оба показателя для альфапротеобактерий выше таковых у гаммапротеобактерий. Это согласуется с предыдущим результатом. То есть, можно сделать заключение, что находки среди альфапротеобактерий лучше. Это значит, что профилю, построенному по митохондриальным белкам эукариот, более соответствуют белки альфапротеобактерий, нежели гаммапротеобактерий. Это может в какой-то степени свидетельствует о большей близости белка s12 митохондрий к альфапротеобактериям.
Получили 6 последовательностей рибосомальных белков s12 из разных родов Firmicutes. Построили объединенное выравнивание митохондриальных белков и белков из рибосом альфа-, гаммапротеобактерий и фирмикут посредством программы muscle на сервере kodomo.
С помощью программы proml пакета PHYLIP по полученному выравниванию было построено дерево. Out-группой была выбрана одна из последовательностей фирмикут.
Ниже представлено изображение этого дерева, полученное с помощью программы GeneMaster. Листья, отвечающие последовательностям альфапротеобактерий покрашены красным цветом, гаммапротеобактериям - синим цветом, последовательностям митохондриальных белков эукариот зелёным цветом и формикутам фиолетовым цветом.
Видно, что эукариотические последовательности разделились на 2 неравные группы.
Первая (большая) ближе к альфапротеобактериям. Все последовательности этой группы принадлежат к растениям, грибам и простейшим. Наиболее близкий организм к ним из альфапротеобактеиям, как я считаю, это Orientia tsutsugamushi (Rickettsia tsutsugamushi) (AC - A5CF21).
Вторая (меньшая) группа содержит всего 4 последовательности, 3 из которых принадлежат млекопитающим. Эта группа явно ближе к гаммапротеобактериям, ближайшие представиетели Candidatus Carsonella (AC - Q9AIG9).
Для исследуемых последовательностей были определены попарные эволюционные расстояния с помощью программы protdist пакета PHYLIP. Полученную матрицу импoртировали в Exel и построили гистограмму распределения попарных расстояний между рибосомальными белками митохондрий эукариот и белками из альфа- и гаммапротеобактерий.
Расстояние, на которое приходится максимум находок для альфапротеобактерий немного меньше такового для гаммапротеобактерий, что в первом приближении говорит о большей эволюционной близости рибосомального белка s12 альфапротеобактерий к рибосомальному белку митохондрий эукариот, нежели гаммапротеобактерий.
В ходе данной работы несколькими способами сравнивались рибосомальныйе белок s12 митохондрий различных эукариот с рибосомальными белками альфапротеобактерий и гаммапротеобактерий. Практически все результаты показывают, что эукариотические белки сответствуют большим образом альфапротеобактериям, нежели гаммапротеобактериям. В частности,как можно видеть по филогенетическому дереву, семейству Rickettsiaceae. Однако, изначально выборка эукариотических белков была сильно неоднородна (17 последовательность растений, 1 последовательность низших грибов, 3 последовательности простейших, 3 последовательности млекопитающих), что могло сильно повлиять на результаты. По филогенетическому дереву видно, что небольшая часть эукариотических митохондриальных белков (в основном белки млекопитащих) всё же ближе к гаммапротеобактериям. Поэтому, возможно,каждый раз для альфапротеобактерий результат был лучше просто из-за большого дисбаланса в выборке. Возможно, эволюция рибосомального белка s12 митохондрий у растений и,например, млекопитающих, шла по-разному и от разных предковых форм.Но чтобы ответить на поставленный вопрос наверняка, несомненно необходимо провести более тщательный анализ, в котором выборка эукариотических белков будет полнее и будет содержать приблизительно равные количества последовательностей как растений, простейших и грибов, так и млекопитающих.