На главную |
|
Мои проекты | Ссылки | Обо мне | Мои заметки |
Эволюционные домены 1
Выбор домена
Так как в задании 7 я работала с секреторной системой 3 типа, то решила рассматривать белок из неё: Q9PJI1. Белок SctJ системы секреции типа III.
Белок содердит домен, характерный для семейства секреторных белков YscJ/FliF (AC YscJ_FliF и ID PF01514). Домен содержится в 3384 последовательностях, и 2156 видах. Домен входит в 9 архитектур.
Домен часто втречается у белков, схожих с липопротеином YscJ и с флагеллярным M-кольцевым белком FliF (N-терминальным концом). Белки семейства YscJ участвуют в секреции нескольких белков, в частности, фактора патогенности в грамм-отрицательных бактериях (как и положено системам III типа) .
На рисунке: слева - система секреции типа III, справа - базальное тело флагеллы. Кольцо YscJ образует канал внутренней мембраны. FliF формирует канал для экспорта и скелет для сборки флагеллы. Внеклеточное пространство (ES), клеточная стенка (CW), периплазма (P), цитоплазма (C) грамм-отрицательной бактерии.
Скачала выравнивание для выбранного домена PF01514 из Pfam с помощью JalView. Раскрасила по консервативности (BLOSUM62, порог консервативности 25). Выравнивание можно скачать здесь.
Выбор архитектур
ВЫбраны две двух-доменные архитектуры:
с доменами YscJ_FliF (домен моего белка), YscJ_FliF_C (ID PF08345) - 2203 последовательности;
с доменами YscJ_FliF (домен моего белка), FliG_M (ID PF14841) - 33 последовательности.
Домен YscJ_FliF_C (ID PF08345) или C-концевая последовательность M-кольца флагеллы - это домен, который встречается в M-кольце бактериальных флагелл наряду с доменом моего белка.
Домен FliG_M (ID PF14841) или средний FliG домен - это средний домен белка FliG из ротора флагеллы.
Но с архитектурой с доменами YscJ_FliF (домен моего белка), FliG_M (ID PF14841) возникли проблемы с получением таксономии, и в качестве второй архитектуры пришлось взять однодоменную (домен моего белка) с 1128 последовательностями.
Получаю таблицу с информацией об архитектуре всех последовательностей, содержащих домен YscJ_FliF. Использую скрипт отбирающий последовательности с указанным доменом и составляющий таблицу для Excel
Составила список последовательностей с указанием доменной архитектуры.
В список последовательностей добавила колонки с информацией о таксономической принадлежности.
Скачиваю полные записи всех последовательностей, использую скрипт uniprot_to_taxonomy.py. Получаю таксономию. С таблицей можно ознакомиться здесь
Выбор таксона
Выбираю класс Gammaproteobacteria, в котором подтаксоны следующих уровней достаточно представлены последовательностями.
В класс Gammaproteobacteria входят как фототрофные бактерии, метанотрофы, так и бактерии, важные с клинической и научной точки зрения — семейства Enterobacteriaceae, Vibrionaceae, Pseudomonadaceae, Francisellaceae, Legionellaceae и Pasteurellaceae. В эту группу входят и возбудители особо опасных инфекций - Yersinia pestis, Francisella tularensis, Haemophilus influenzae, Legionella pneumophila и Vibrio cholerae, а также важный модельный организм Escherichia coli.
Сравниваемые в следующем практикуме таксоны - это порядки:
Aeromonadales - ae, Enterobacteriales - en, Alteromonadales - al, Vibrionales - vi, Oceanospirillales - oc, Pseudomonadales - ps, Xanthomonadales - xa.
Выбор представителей архитектур
Выбрала 29 последовательностей из каждой архитектуры и привожу их таксономию - лист выборка в таблице Excel.
Последовательность с известной 3D-структурой 1YJ7 - Q8VQD3_ECOLX (вторая архитектура).
Оставляю в выравнивании только нужные последовательности из двух групп. Получаю файл id.fasta. Создаю группы, по одной на всех представителей архитектуры и задаю раскраску в каждой группе c порогом консервативности 30.
Добавляю разметку по вторичной структуре, исходя из последовательности Q8VQD3_ECOLX с известной 3D-структурой 1YJ7. На месте спиралей и тяжей, составляющих ядро домена гэпов не было, за исключением последнего тяжа, гэпы в котором я решила оставить (для второй архитектуры в данном учатке довольно плохое выравнивание). Удаляю N-концевые и C-концевые участки, т.к. в них нет хорошего выравнивания.
Сохраняю выравнивание. Выравнивание включает в себя 58 последовательностей. Его, в целом, можно поссчитать неплохим. Для второй архитектуры самые хорошие учатски находятся на размеченных спиралях и тяжах. При этом довольно существенно различие между последовательностями одного домена, относящегося к разным архитектурам.