Занятие 10: Эволюция доменной архитектуры |
||
|
AC: PF05139
Таблица Excel с описанием последовательностей Выравнивание выборки последовательностей из двух архитектур Построение филогенетического дерева выборки последовательностей Выравнивание с отредактированными именами последовательностей Расшифровка: 1 - доменная архитектура E9CW7_COCPS (однодоменная) 2 - доменная архитектура D3D9M8_9ACTO (двудоменная) Pb - Протеобактерии Ab - Актинобактерии Cy - Цианобактерии Ch - Chlamydiae (из царства Бактерий) F - Фирмикуты (из царства Бактерий) B - Bacteroidetes (из царства Бактерий) A - Археи E - Эукариоты Филогенетическое дерево, построенное методом UPGMA: Видно, что клады на дереве расположены хаотично, четкого разделения по доменным аархитектурам, либо по таксономии не произошло. На мой взгляд, это дерево построено неправильно и ориентироваться на него нельзя. Скобочная формула Филогенетическое дерево, построенное методом Neighbor-Joining: Здесь, очевидно, произошло разделение по доменным архитектурам (исключение составляет одна последовательность, выделенная толстой серой линией, по-видимому это небольшая погрешность). По данному дереву я могу предположить, что доменные архитектуры E9CW7_COCPS и D3D9M8_9ACTO развивались независимо друг от друга. Также видно достаточно четкое разделение по таксонам: видно разделение на Актино- и Протеобактерий с двудоменной архитектурой; у Бактерий независимо эволюционировала однодоменная архитектура, причем в какой-то момент времени в ней выделились эукариотческая и архейная архитектуры. Скобочная формула Профили Получены профили для первой и второй групп последовательностей График зависимости числа ошибок первого (False Negatives) и второго (False Positives) рода от порогового значения score для первого профиля: Данный профиль не позволяет отличить первую группу последовательностей График зависимости числа ошибок первого (False Negatives) и второго (False Positives) рода от порогового значения score для второго профиля: ![]() Второй профиль позволяет отличить вторую группу последовательностей: при пороговом значении, равном 110, число верных находок (True Positives) равно 23, верно пропущенных последовательностей (True Negativies) - 17, число ошибок первого и второго рода равны 0. Жаль, конечно, что первый профиль получился плохо, зато второй - отличный, этого и следовало ожидать, потому что в выравнивании второй группы последовательностей, в отличие от первой, очень много высококонсервативных позиций. Также я провела поиск по банку SwissProt, используя второй профиль. Нашлась лишь одна последовательность с доменной архитектурой D3D9M8_9ACTO, что соответствует истине. Столь малое количество находок можно объяснить тем, что уже после проведения поиска я узнала, что все последовательности из моего выравнивания (кроме одной найденной) были взяты не из SwissProt, а из TrEMBL.
|
||