Для этого задания я использовала белки из практикума 10. В таблице 1 приведены основные данные этих белков.
Entry | Entry name | Protein names | Length | Organism | Superkingdom |
Q07US6 | DNAK_RHOP5 | Chaperone protein DnaK (HSP70) | 633 | Rhodopseudomonas palustris (strain BisA53) | Bacteria |
A1T2S3 | DNAK_MYCVP | Chaperone protein DnaK (HSP70) | 622 | Mycobacterium vanbaalenii (strain DSM 7251 / PYR-1) | Bacteria |
O65719 | HSP7C_ARATH | Heat shock 70 kDa protein 3 | 649 | Arabidopsis thaliana (Mouse-ear cress) | Eukaryota |
P27541 | HSP70_BRUMA | Heat shock 70 kDa protein | 644 | Brugia malayi (Filarial nematode worm) | Eukaryota |
Q9HRY2 | DNAK_HALSA | Chaperone protein DnaK (HSP70) | 629 | Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) (Halobacterium halobium) | Archaea |
Q97BG8 | DNAK_THEVO | Chaperone protein DnaK (HSP70) | 613 | Thermoplasma volcanium (strain ATCC 51530 / DSM 4299 / JCM 9571 / NBRC 15438 / GSS1) | Archaea |
Таблица 1.Основные данные.
Я использовала 4 программы для выравниваний: Tcoffee with Defaults, Probcons with Defaults, Muscle with Defaults и Crustal with Defaults. Выравнивания раскрашены по сехеме Crustalx без порога. Выравнивания целиком можно посмотреть по ссылке или нажав на рисунки.
Рисунок 1. Начало выравниваний.
Рисунок 2. Конец выравниваний.
Видно, что выравнивания отличаются, но в разной степени. Первые два весьма схожи, в то время как первое и последнее различаются сильно. Я буду сравнивать 2 выравнивания - Tcoffee with Defaults и Muscle with Defaults.
В Pfam я нашла свой белок - CRISPR-assotiated endonuclease Cas9, взятый из организма Mycoplasma. Он состоит из четырех доменов (см рисунок 3 и рисунок 4).
Рисунок 3. Доменная архитектура моего белка.
Рисунок 4. Данные. | Рисунок 5. Примеры белков с данной архитектурой. |
Я решила искать белки, в состав которых входит домен Cas9_Rec (все эти белки - это эндонуклеазы Cas9, входящие в CRISPR-систему). Всего поиск выдал 6 видов доменных архитектур, включая архитектуру моего белка (см ссылку), но следует понимать, что один тип архитектуры - это порядок, число и имена доменов, делеции фрагментов доменов не учитываются (то есть входят в один тип архитектуры), в отличие от дупликаций. Я опишу три архитектуры.
Рисунок 6.
Мой белок (рисунок 6). Состоит из 4 доменов. Белков, содержащих домен Cas9_REC с такой доменной архитектурой, больше всего - 99 белков.
Рисунок 7.
Другой вариант. Присутствуют всего два домена из четырех моего белка (Cas9_REC и HNH_4), причем произошла делеция конца и начала домена Cas9_REC.
Рисунок 8.
Самый редко встречающийся вариант (всего 1 белок). В нем присутствуют все 4 домена моего белка, при этом фрагмент домена Cas9_REC дуплицировался.
НАЗАД ➜ |
© <Рюмина Екатерина>, 2017 |