Выбор домена, архитектур и таксонов, их краткое описание
Выбор домена

В результате отбора по нужным показателям, был выбран домен PF00381

AC: PF00134
ID: Cyclin_N
Функция: семейство белков, контролирующих прогрессию клеточного цикла, с помощью циклин-зависимых киназных ферментов
В базе Pfam записано 6213 последовательностей, 547 видов и 86 архитектур.ссылка
Для всех последовательностей, содержащих домен, было получено выравнивание и 3D структура (к последовательности CCNA2_HUMAN PDB ID 1E9H). В выравнивании окраска по шаблону ClustalX с порогом консервативности 15%.
Выбор доменных архитектур
Для всех белков Uniprot, в которых был обнаружен рассматриваемый домен, была составлена сводная таблица. Также в таблицу были добавлены колонки таксономической принадлежности и столбец с информацией о длине домена Cyclin_N.
Далее были выбраны архитектуры Cyclin_N, Cyclin_C( двухдоменная) и F-box, Cyclin_N, Cyclin_C (трехдоменная).
Архитектура Число представителей Описание второго домена
2770 Cyclin_C: C-концевой домен циклина
F-box, Cyclin_N, Cyclin_C 34 F-box: домен, распологающийся в N-концевой части различных белков и участвующий в белок-белковых взаимодействиях и в таких процессах, как стадия элонгации транскрипции, связывание центромер
Cyclin_C: C-концевой домен циклина

Выбор таксона и подтаксонов

Для изучения указанных выше архитектур был выбран таксон Euteleostomi: с подтаксонами Mammalia, Amphibia, Actinopterygii для первой из них, Eutheria, Batrachia, Metatheria, Dinosauria для второй.

Euteleostomi представляет собой монофилитическую группу, включающую в себя более 90% современных позвоночных. Класс млекопитающиеMammalia – относится к подтипу позвоночные (Vertebrata), который является высшим подтипом хордовых. Класс земноводныеAmphibia – состоит из наиболее примитивных наземных позвоночных. К классу лучепёрых рыб (из надкласса костных рыб) – Actinopterygii – относятся около 95% современных видов рыб. Инфраклассы плацентарных (Eutheria) и сумчатых (Metatheria) выделяют в подклассе Theria класса Mammalia (по одной из классификаций); Batrachia и Dinosauria включают в себя земноводных и пресмыкающихся соответственно.


Выбор представителей архитектур
Из каждой архитектуры отобрали последовательности 36 для первой и 29 для второй, результаты выбора последовательностей представлены на листе Distinguished в файле Excel и использовались для составления в выравнивании нужных последовательностей из 2-х групп. При этом также была добавлена последовательность CCNA2_HUMAN с трехмерной структурой PDB ID 1E9H, по которой в дальнейшем была добавлена разметка (аннотация CCNA2_HUMAN annotation в JalView). Полученное выравнивание было загружено в JalView и отредактировано удалением пустых колонок. Также были выделены группы согласно архитектуре, раскрасили последовательности ClustalX c порогами консервативности 30% и 50% для первой и второй групп соответственно. Далее повторно редактировали выравнивания,(удалив несодержательные N- и С-концевые участки , удалили некоторые последовательности и пустые колонки) в файле выравнивания содержится 55 последовательностей
ert
Рис.1Выравнивание выборки для двух архитектур домена Cyclin_N

Построение филогенетического дерева по выборке доменов из двух архитектур
Для построения филогенетического дерева отредактировали имена последовательностей и двух- и трехдоменные архитектуры отметили цифрами 2 и 3.Выбранные таксоны были отмечены:
Двухдоменная (Cyclin_N, Cyclin_C):
Ma-Mammalia; Am-Amphibia; Ac-Actinopterygii
Трехдоменная(F-box, Cyclin_N, Cyclin_C):
Eu-Eutheria;Ba-Batrachia, Me-Metatheria, Di-Dinosauria
Построение дерева на основе выравнивания для сравнения было выполнено методами UPGMA и Neighbor-Joining.
shot

UPGMA (топология)

shot

Neighbor-Joining (топология)

shot

UPGMA

shot

Neighbor-Joining

Скобочные формулы для деревьев (формат Newick): UPGMA (топология), Neighbor-Joining (топология).

Для наглядности демонстрации результата можно использовать выделение цветом клад дерева по доменной архитектуре. Серия изображений ниже (они аналогичны приведённым выше деревьям, но содержат дополнительную информацию в виде выделения цветом отдельных элементов дерева) демонстрирует, что доменные архитектуры чётко разграничены в эволюции и их разделение произошло «давно» (в эволюционном смысле). Дерево, построенное методом UPGMA, практически полностью (за исключением некоторых последовательностей) совпадает с деревом, реконструированным по методу Neighbor-Joining и укоренённым таким образом, чтобы две клады соответствовали доменным архитектурам (вообще, такое укоренение не всегда возможно, если рассматривать всё множество возможных топологий для рассматриваемых последовательностей). Разделение на выбранные подтаксоны для последовательностей с рассматриваемой трёхдоменной архитектурой чётко прослеживается в построенных деревьях (точки зелёного цвета приведены в качестве ориентира), чего нельзя сказать о последовательностях с двухдоменной архитектурой: выделяется лишь ветвь, ведущая к млекопитающим (Ma; полупрозрачная точка зелёного цвета приведена в качестве ориентира), однако и в этой кладе встречаются последовательности из лучепёрых рыб (Ac).

shot
shot
shot
shot

Изображения, полученные с помощью сервиса для визуализации филогенетических деревьев iTOL для рассматриваемого набора последовательностей (было использовано дерево, построенное по методу Neighbor-Joining), представлены ниже:

shot
shot


Для оценки достоверности полученных деревьев был использован бутстрэп-анализ, на основании которого можно получить информацию о поддержке ветвей. Изображение для консенсусного дерева, реконструированного по методу UPGMA с использованием Bootstrap (число реплик – 100), приведено ниже. Как видно, деление дерева на 2 клады по доменной архитектуре присутствовало в 100% деревьев при анализе Bootstrap. Также высокую поддержку имеют ветви, ведущие к подтаксонам для трёхдоменной архитектуры. Клада, к которой относятся последовательности всех млекопитающих из числа рассматриваемых (среди последовательностей с двухдоменной архитектурой), присутствовала в 100% случаев.

shot

UPGMA + Bootstrap



Для того, чтобы более точно описать эволюцию доменной архитектуры белков, содержащих домен Cyclin_N, было решено произвести новый выбор таксонов:

Вновь был произведён отбор последовательностей и построение дерева. На основании приведённого ниже изображения дерева, реконструированного по методу UPGMA с использованием 100 реплик Bootstrap, можно сделать предположение, что выделение двух рассматриваемых доменных архитектур произошло ещё до разделения эукариот на царства (в частности, до выделения Metazoa).

shot

UPGMA + Bootstrap




© Boskhomdzhieva Baina, 2014