Эволюционные домены
1. Выбор домена
Для работы был выбран белок Q1BPP9_BURCA (AC: Q1BPP9) и его домен Secretin_N (PF03958).
Данный белок также использовался в работе №7.
Secretin_N - это
короткий, часто повторяющийся домен, который был найден у белков бактериальной системы секреции II/III типа.
Домену Secretin_N соответствует
49 архитектур,
для которых доступно 6199 последовательностей.
С помощью JalView скачала выравнивание всех последовательностей из Pfam(full).
После раскрасила данное выравнивание по консервативности (BLOSUM62, By
conservation, порог - 20).
Выравнивание, сохраненное как проект можно увидеть тут.
Выравнивание в fasta-формате можно увидеть тут.
2.
Выбор архитектур
C помощью команды python swisspfam_to_xls.py -z -i /srv/databases/pfam/swisspfam.gz
-p Secretin_N -o output.xls была получена таблица
с информацией об архитектуре всех последовательностей.
Таблица
(лист output).
По идентификаторам отобранных последовательностей в UniProt были получены AC (ID
Mapping), по которым был получен файл со
списком AC в формате UniProt (Retrieve), который после был использован для
работы скрипта uniprot-to-taxonomy.py
python uniprot-to-taxonomy.py -i tax.txt -o tax_out.txt
Итоговая таблица
(таксономия перенесена с помощью ВПР).
Выбрано две архитектуры:
1;
2.
Домены |
Число представителей |
Характеристика других доменов |
PF03958 |
58 |
данный
домен описан выше |
PF03958, PF00263 |
1278 |
PF00263
или Secretin - домен, входящий в состав белков
бактериальной системы секреции
II и
III типа. |
3. Выбор таксона
Был выбран таксон - Bacteria; подтаксон - Proteobacteria.
Протеобактерии (лат. Proteobacteria) — наиболее многочисленная группа бактерий — 1534 видов или
примерно треть от всех известных видов бактерий.
Протеобактерии является весьма неоднородной группой, в эту группу включены как симбионты эукариот,
так и большое число патогенных и условно-патогенных микроорганизмов, фото- и хемотрофные виды
бактерий, как автотрофы,
так и гетеротрофы.
Все протеобактерии грамотрицательные.
В группу входят как бактерии, имеющие жгутики,
так и неподвижные бактерии и бактерии, имеющие т. н. «скользящий» тип
движения.
Морфологически группа также неоднородна: сюда входят и палочковидные
бактерии, и кокки,
и спиралевидные бактерии.
Группа была выделена на основании анализа нуклеотидных последовательностей 16S
рРНК, названа в честь древнегреческого бога Протея,
умевшего менять форму по собственному желанию (в названии протеобактерий
отражено большое разнообразие биохимических, физиологических и морфологических
свойств, присущих этой группе).
4. Выбор представителей архитектур
Для каждой архитектуры было выбрано несколько последовательностей.
Таблица
(лист v).
После использовали команду:
python filter_alignment.py -i evdom.fasta -m evdom_ac.txt -o outevd.fasta -f
outevd.msf
Открыла выравнивание в Jalview, разделила архитектуры на
две группы, покрасила по консервативности для обеих групп порог 10.
Проект.
Построение филогенетического дерева по выравниванию представителей домена.
Дерево построено методом
UPGMA (укорененное
дерево, молекулярные часы).
B - Bacteria
P - Proteobacteria
1 - Однодоменная структура
2 - Двухдоменная структура

©Melnichuk Anastasia