Эволюционные домены


Для работы был выбран НАД-связывающий домен яблочного фермента (малатдекарбоксиалазы). Этот фермент катализирует декарбоксилирование яблочной кислоты в пируват. Существует НАДФ- и НАД-зависимая изоформа этого фермента.
Некоторая информация об изучаемом домене с сайта Pfam:

AC ID Функция Число последовательностей Число архитектур
PF03949 Malic_M Связывание НАД 6923 36

Было получено выравнивание всех последовательностей Pfam домена Malic_M: проект jar и fasta. В файле jar последовательность человеческого домена (MAOM_HUMAN) проассоциирована с 3D-структурой.
Для работы были выбраны 2 архитектуры Pfam, содержащие домен Malic_M:

Архитектура Число доменов Кратко о втором домене Число последовательностей
Malic_M + malic 2 PF00390: N-концевой домен малатдекарбоксилаз 4298
Malic_M + malic(x2) 3 PF00390: N-концевой домен малатдекарбоксилаз 602

С помощью скрипта swisspfam-to-xls.py была получена таблица excel с информацией о последовательностях рассматриваемого домена, затем данные были представлены в виде сводной таблицы.
Затем с помощью функции retrieve на сайте Uniprot по AC последовательнсотей были получены записи о них, а затем с помощью скрипта uniprot-to-taxonomy.py данные об их таксономической принадлежности (файл).
В качестве рассматриваемого таксона были выбраны Bacteria и его 2 наиболее представленных среди последовательеностей подтаксона: Proteobacteria и Firmicutes. В каждом подтаксоне было выбрано по несколько последовательнсотей домена, включенных в обе архитектуры. (Файл с информацией о выборке)

Архитектура Число последовательностей Proteobacteria Firmicutes
Malic_M + malic 26 15 11
Malic_M + malic(x2) 30 15 15

Затем скриптом filter-alignment.py из общего выравнивания были удалены ве последовательности кроме выбранных, удалены пустые колонки выравнивания. Названия последовательностей были заменены кодом и видовым названием. Буква кода указывает на подтаксон, цифра - на количество доменов в архитектуре.
Таблица кодов:
Архитектура Proteobacteria Firmicutes
Malic_M + malic P2 F2
Malic_M + malic(x2) P3 F3

После всех преобразований выравнивание приобрело следующий вид:


Рисунок 1. Выравнивания домена Malic_M из выбранных структур и подтаксонов, раскраска ClustalX, порог по умолчанию

Затем по этому выравниванию методом maximal likelihood было постороено филогенентическое дерево, использовался bootstrap.
Рисунок 2. Филогенетическое дерево домена Malic_M, построенное методом maximal likelyhood с использованием бутстрэпа.

Рассмт=отрим полученное дерево, сделаем предположение относительно эволюции архитектур. Рассмотрим сначала Proteobacteria. В этом подтаксоне отчетливо видны 2 клады: желтая (с трехдоменной архитектурой)и красная (с двухдоменной фрхитектурой). Помимо этих двух клад, есть несколько клад в которых присутствуют обе архитектуры. Причем красная клада отделилась раньше все остальных. Я склонен предположить, что у общего предка этого подтаксона были обе архитектуры, и в процессе эволюции организмы красной клады утратили трехдоменную структуру, а организмы желтой клады - двухдоменную. В остальных же группах сохранились обе архитектуры.
Для подтаксона Firmicutes наблюдается еще менее четкая эволюционная картина, похоже, что более или менее во всех группах организмов здесь сохранились обе архитектуры. Таким образом, я предполагаю, что у общего предка Proteobacteria и Firmicutes имелись обе архитектуры.
Вероятно Firmicutes нужны для жизни обе архитектуры, а протеобактерии пошли по пути большей дивергенции, разные группы эволюционировали по-разному.

Рисунок 3. Схематичное изображение эволюции рассматриваемых архитектур в выбранных таксонах.
2 - двухдоменная архитектура, 3 - трехдоменная.


Главная страница Первый семестр Второй семестр Третий семестр Обо мне Ссылки


© Марк Меерсон, 2014
Последнее обовление: 05.05.2014