Алгоритмы множественного выравнивания.Pfam

Задание 1. Различия в множественных выравниваниях.

Для этого задания я использовала белки из практикума 10. В таблице 1 приведены основные данные этих белков.

EntryEntry nameProtein namesLengthOrganismSuperkingdom
Q07US6DNAK_RHOP5Chaperone protein DnaK (HSP70) 633Rhodopseudomonas palustris (strain BisA53) Bacteria
A1T2S3DNAK_MYCVPChaperone protein DnaK (HSP70)622Mycobacterium vanbaalenii (strain DSM 7251 / PYR-1) Bacteria
O65719HSP7C_ARATHHeat shock 70 kDa protein 3649Arabidopsis thaliana (Mouse-ear cress) Eukaryota
P27541HSP70_BRUMAHeat shock 70 kDa protein644Brugia malayi (Filarial nematode worm) Eukaryota
Q9HRY2DNAK_HALSAChaperone protein DnaK (HSP70)629Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) (Halobacterium halobium) Archaea
Q97BG8DNAK_THEVOChaperone protein DnaK (HSP70)613Thermoplasma volcanium (strain ATCC 51530 / DSM 4299 / JCM 9571 / NBRC 15438 / GSS1) Archaea

Таблица 1.Основные данные.

Я использовала 4 программы для выравниваний: Tcoffee with Defaults, Probcons with Defaults, Muscle with Defaults и Crustal with Defaults. Выравнивания раскрашены по сехеме Crustalx без порога. Выравнивания целиком можно посмотреть по ссылке или нажав на рисунки.

Рисунок 1. Начало выравниваний.

Рисунок 2. Конец выравниваний.

Видно, что выравнивания отличаются, но в разной степени. Первые два весьма схожи, в то время как первое и последнее различаются сильно. Я буду сравнивать 2 выравнивания - Tcoffee with Defaults и Muscle with Defaults.

Задание 2. Белки с одинаковым доменом

В Pfam я нашла свой белок - CRISPR-assotiated endonuclease Cas9, взятый из организма Mycoplasma. Он состоит из четырех доменов (см рисунок 3 и рисунок 4).

Рисунок 3. Доменная архитектура моего белка.

Рисунок 4. Данные.Рисунок 5. Примеры белков с данной архитектурой.

Я решила искать белки, в состав которых входит домен Cas9_Rec (все эти белки - это эндонуклеазы Cas9, входящие в CRISPR-систему). Всего поиск выдал 6 видов доменных архитектур, включая архитектуру моего белка (см ссылку), но следует понимать, что один тип архитектуры - это порядок, число и имена доменов, делеции фрагментов доменов не учитываются (то есть входят в один тип архитектуры), в отличие от дупликаций. Я опишу три архитектуры.


  1. Рисунок 6.

    Мой белок (рисунок 6). Состоит из 4 доменов. Белков, содержащих домен Cas9_REC с такой доменной архитектурой, больше всего - 99 белков.


  2. Рисунок 7.

    Другой вариант. Присутствуют всего два домена из четырех моего белка (Cas9_REC и HNH_4), причем произошла делеция конца и начала домена Cas9_REC.


  3. Рисунок 8.

    Самый редко встречающийся вариант (всего 1 белок). В нем присутствуют все 4 домена моего белка, при этом фрагмент домена Cas9_REC дуплицировался.



НАЗАД ➜
© <Рюмина Екатерина>, 2017