Личный сайт
Просвирова Кирилла

Занятие 11

Часть 1: выбрать объекты изучения и построить выравнивание

Было выбрано семейство MCM_N c AC PF14551 (ссылка). Это MCM N-концевой домен. Сам домен состоит из трех структурных элементов 4-х спиральная петля, мотив для связывания цинковых пальцев и OB-подобный элемент укладки. Домен содержит N-концевой участок белка поддержки минихромосом. Встречается исключительно у эукариот. Играет роль в инициации и элонганции репликации эукариотической ДНК. Домен имеет 42 архитектуры, который доступны по ссылке. В качестве таксона верхнего порядка я выбрал Cellulata, подтаксона стали Fungi и Metazoa.

Рис. 1. Выбранные архитектуры. Верхняя - I, нижняя - II.

Excel файлы: файл со сводкой из Uniprot по всем организмам имеющим мой домен, файл с выбранными мною последовательностями для дальнейшней работы. Получены при помощи swisspfam-to-xls.py, uniprot-to-taxonomy.py, Uniprot ID retriever. Далее было получено выравнивание всех последовательностей из данного семейства (ссыслка на проект) и выбранных последовательностей (ссылка на проект). Раскраска Blosum62, Above identity threshold 70%, убраны пустые колонки. В выравнивании есть сильно консервативные позиции (например, заряженный R в моём домене), они выравнены и окрашены, поэтому можно судить о правильности выравнивания. Несколько последовательностей были откровенно неправильно выравнены/имели совсем непохожие последовательности. Они были изъяты.

Часть 2: построение филогенетического дерева домена


Рис. 2. Консенсусное дерево выравнивания. Разным цветом отмечены разные хорошие подсемейства.


Скобочная структура дерева доступна по ссылке. Дерево построено в MEGA алгоритмом Maximum-Likelihood.

Часть 3: построить профиль подсемейства и охарактеризовать качество его работы

Для работы было выбрано подсемейство, отмеченное сиреневым цветом на рисунке 2. В названиях введены следующие обозначения. 1 - первая, 2 - вторая архитектуры в соответствии с рисунком 1. F - Fungi, M - metazoa.
Построенный профиль можно посмотреть по ссылке.

Рис. 3. ROC-кривая.


Порог: 1.6e+03. Чувствительность = 0.25, специфичность = 0.99.

На самом деле

принадлежит подсемейству

не принадлежит

сумма

Выше порога по профилю

8

24

32

Ниже порога

5

2179

2184

сумма

13

2203

2216

Вывод: нельзя.

Просвиров Кирилл. Дата последнего изменения: 15 мая 2015.