Алгоритмы множественного выравнивания. Pfam

Задание 1. Найдите различия во множественных выравниваниях, построенных разными программами

Первый блок последовательностей выровнен с помощью программы T-Coffee with defaults, второй - с помощью программы Muscle

На изображении красными прямоугольниками выделены области различия в выравниваниях.
1. В первом случае T-Coffee предпочла поставить метионин в первой позиции во всех четырёх последовательностях, что предполагает вставку пяти аминокислот между метионином(1) и аспарагиновой кислотой(7) в четвертой последовательности. Muscle предположила, что в четвертой последовательности произошла замена метионина тирозином и удлинение концевого участка на пять аминокислот.
2. Во втором случае Muscle поставила гэп между аланином(27) и аспарагиновой кислотой(29) во второй последовательнсоти, предположив гомологию D(29) второй и четвертой последовательности; T-Coffee в этом месте почему-то предпочла выровнять отрицательно заряженную D(28) из второй строки с незаряженным L из первой, а D(34) из четвертой строки с ароматическим незаряженным F первых трёх. Muscle выровняла Y(30) первой и четвертой последовательности и P(32) в последних трех строках; T-Coffee предположила, что гомологии в этих местах нет.
3. В третьем случае в выравнивании, построенном T-Coffee лейцин занимает 45 позицию в первой, второй и третьей строках; Muscle расположила лейцин в четвертой строке на позиции 46 под метионинами первых трёх строк. T-Coffee поместила метионин третьей строки на позицию 45, предположив гомологию с лейцинами остальных трёх строк.

Задание 2. Опишите три доменных архитектуры, содержащих один и тот же домен

Гомеодомен — это структурный домен белков, связывающих ДНК или РНК, широко распространенный среди факторов транскрипции. Домен состоит из 60 остатков аминокислот, и образует структуру спираль-поворот-спираль, в которой альфа-спирали связаны короткими петлевыми участками. Две спирали на N-конце являются антипараллельными, и длиннее спирали на C-конце, которая перпендикулярна осям N-концевым петлям. Непосредственно С-концевая спираль взаимодействует с ДНК. Укладка доменов белков по типу гомеодомена встречается исключительно у эукариот, но гомологична белкам фага лямбда, которые изменяют экспрессию генов прокариот. У эукариот гомеодомены индуцируют дифференцировку клеток, запуская каскады генов, необходимых для образования тканей и органов.

Были выбраны три архитектуры, содержащие домен Homeobox:

1. 26 последовательностей с архитектурой Syja_N, LIM x 2, Homeobox

E5SRC8_TRISP [Trichinella spiralis (Trichina worm)] Insulin protein enhancer protein ISL-1 {ECO:0000313|EMBL:EFV52660.1}

Архитектура, схема которой представлена выше, содержит три участка низкой сложности (изображены голубыми прямоугольниками); красными прямоугольниками обозначены семь участков, содержащих альфа-спиральный трансмембранный фрагмент интегрального белка. Серые прямоугольники соответствуют участкам последовательности, содержащим неупорядоченные белки (не имеющие стабильной трёхмерной структуры).
Помимо домена Homeobox, архитектура содержит SacI homology domain (семейство белков, гомологичных дрожжевому ферменту фосфоинозитид фосфатазе SAC1 P32368) и два домена LIM (структура, состоящая из двух цинковых пальцев, разделенных гидрофобным мостиком из двух аминокислотных остатков), обозначенные на схеме синими овалами.

2. 339 последовательностей с архитектурой Homeobox, START, MEKHLA

W9S776_9ROSA [Morus notabilis] Homeobox-leucine zipper protein ATHB-8 {ECO:0000313|EMBL:EXB93391.1}

Архитектура содержит один участок низкой сложности и шесть участков, содержащих неупорядоченные белки. Зеленым прямоугольником обозначена область спиральной катушки (coiled coil; участок, содержащий альфа-спирали, закрученные относительно друг друга).
Архитектура содержит домен START (связывающий липиды домен, находящийся в стероидогенном остром регуляторном белке, отвечающем за доставку холестерина в митохондрии) и домен MEKHLA (структура не до конца известна, скорее всего схожа со структурой домена PAS).

3. 161 последовательность с архитектурой ULD, CUTL, CUT x 2, Homeobox

W5Q210_SHEEP [Ovis aries (Sheep)] DNA-binding protein SATB {ECO:0000256|RuleBase:RU361129}

Архитектура содержит один участок низкой сложности и большое количество участков, содержащих неструктурированные белки.
Помимо Homeobox, архитектура содержит домены ULD(убиквитин-подобный N-концевой домен олигомеризации белков семейства SATB), CUTL (ДНК-связывающий домен на N-концевом участке белков семейства SATB) и два домена CUT (связывающий ДНК мотив, часто встречающийся с гомеодоменом).