"Эволюционные домены"

Описание выбранного домена

Я выбрал домен белка GLSA1_BACSU, который я изучал на первом курсе.

AC: PF04960

ID: Glutaminase

Функция:

Это целое семейство ферментов, которые способствуют получению глутамата из глутамина. Классификая EC:3.5.1.2. Встречаются разные изоферменты в разных типах тканях, но по сути они катализируют одну и ту же реакцию:

Glutamine + H2O = Glutamate + NH3

Схема из Pfam:

Ccылка на страницу домена в Pfam

Ccылка на список разных доменных архитектур с доменом и указанием числа последовательностей

Общее выравнивание из Pfam

Выбор доменных архитектур


Первая архитектура, состоящая из одного домена, представлена на рисунке слева. Она самая распространенная, ею обладают 2223 представителя. Функция данного домена описана выше. Вторая архитектура, что справа, состоит из ещё одного домена - Ank_2. Этот мотив состоит из 33 остатков. Он участвует в белок-белковом взаимодействии. Данной архитектурой обладают 182 представителя.

Скрипт swisspfam_to_xls.py у меня сработал только после того, как я дал ему на вход ID вместо AC.

На странице с доменными архитектурами Pfam я кликнул "Show all sequences with this architecture" и копировал содержимое в файл. Выделил оттуда все ID. Воспользовался Uniprot Retrieve, чтобы получить соответствующие последовательности.

Выдача скрипта

Последовательности, имеющие первую архитектуру

Последовательности, имеющие вторую архитектуру

ID mapping я не использовал, так как Retrieve мне помог найти последовательности с помощью ID

Выбор таксонов

Скрипт python uniprot_to_taxonomy.py прекрасно сработал.

Для второй архитектуры не так богатой на последовательность, как первая, было выбрано 16 последовательностей из двух царств: животные и бактерии.

Для первой архитектуры очень много представителей из бактерий. Для эукариот представлены два царства: животные и грибы. Всего было выбрано 21 последовательность.

Файл Excel с выбранными последовательностями

Выбор представителей архитектур

Ниже представлено полученное выравнивание. Чтобы добиться хорошего результата, пришлось его подредактировать. Пришлось удалить ненужные пустые последовательности с N-конца и пустые колонки, а также удалить некоторые последовательности. Окраска сделана с порогом консервативности 15%.

Итоговое выравнивание