Главная Семестры Проекты Обо мне

Эволюционные домены

1. Выбор домена

Для работы был выбран белок Q1BPP9_BURCA (AC: Q1BPP9) и его домен Secretin_N (PF03958).
Данный белок также использовался в работе №7.

Secretin_N - это короткий, часто повторяющийся домен, который был найден у белков бактериальной системы секреции II/III типа.

Домену Secretin_N соответствует 49 архитектур, для которых доступно 6199 последовательностей.

С помощью JalView скачала выравнивание всех последовательностей из Pfam(full).
После раскрасила данное выравнивание по консервативности (BLOSUM62, By conservation, порог - 20).
Выравнивание, сохраненное как проект можно увидеть тут.
Выравнивание в fasta-формате можно увидеть тут.

2. Выбор архитектур

C помощью команды python swisspfam_to_xls.py -z -i /srv/databases/pfam/swisspfam.gz -p Secretin_N -o output.xls была получена таблица с информацией об архитектуре всех последовательностей.
Таблица (лист output).

По идентификаторам отобранных последовательностей в UniProt были получены AC (ID Mapping), по которым был получен файл со списком AC в формате UniProt (Retrieve), который после был использован для работы скрипта  uniprot-to-taxonomy.py
python uniprot-to-taxonomy.py -i tax.txt -o tax_out.txt

Итоговая таблица (таксономия перенесена с помощью ВПР).

Выбрано две архитектуры:
            1;
            2.

Домены Число представителей Характеристика других доменов
PF03958 58 данный домен описан выше
PF03958, PF00263 1278 PF00263 или Secretin - домен, входящий в состав белков бактериальной системы секреции II и III типа.


3. Выбор таксона

Был выбран таксон - Bacteria; подтаксон - Proteobacteria.

Протеобактерии (лат. Proteobacteria) — наиболее многочисленная группа бактерий — 1534 видов или примерно треть от всех известных видов бактерий.
Протеобактерии является весьма неоднородной группой, в эту группу включены как симбионты эукариот, так и большое число патогенных и условно-патогенных микроорганизмов, фото- и хемотрофные виды бактерий, как автотрофы, так и гетеротрофы.
Все протеобактерии грамотрицательные.
В группу входят как бактерии, имеющие жгутики, так и неподвижные бактерии и бактерии, имеющие т. н. «скользящий» тип движения.
Морфологически группа также неоднородна: сюда входят и палочковидные бактерии, и кокки, и спиралевидные бактерии.
Группа была выделена на основании анализа нуклеотидных последовательностей 16S рРНК, названа в честь древнегреческого бога Протея, умевшего менять форму по собственному желанию (в названии протеобактерий отражено большое разнообразие биохимических, физиологических и морфологических свойств, присущих этой группе).


4. Выбор представителей архитектур

Для каждой архитектуры было выбрано несколько последовательностей.
Таблица (лист v).
После использовали команду:
python filter_alignment.py -i evdom.fasta -m evdom_ac.txt -o outevd.fasta -f outevd.msf
Открыла выравнивание в Jalview, разделила архитектуры на две группы, покрасила по консервативности для обеих групп порог 10.
Проект.

Построение филогенетического дерева по выравниванию представителей домена.


Дерево построено методом UPGMA (укорененное дерево, молекулярные часы).


B - Bacteria
P - Proteobacteria
1 - Однодоменная структура
2 - Двухдоменная структура






©Melnichuk Anastasia