Учебный сайт Юдиной А.С.

Главная

Обо мне

Семестры

Алгоритмы множественного выравнивания.

Различия во множественных выравниваниях

Для выполнения задания по сравнениюмножественных выравниваний в разных программах я взяла последоваетльности белков, чью гомологию я выяснила при выполнении задания практикума 12. Я взялась рассматривать выранивания следующих белков из таблицы и белка chitin-binding protein из штамма Streptomyces globisporus C-1027.

ID Название Coverage, % Identity, % E-value Гомологичность
WP_033338167.1 cellulose-binding protein 94 63 3e-66 Да
WP_084964296.1 cellulose-binding protein 97 51 7e-55 Да
KDQ17214.1 carbohydrate-binding module family 33 protein 67 44 1e-28 Да
CDI55928.1 related to Chitin-binding protein 94 35 2e-24 Да
KOX68325.1 GlcNAc-binding protein A 88 30 4e-15 Да
OSH06486.1 carbohydrate binding domain-containing protein 85 27 8e-09 Да

Я выполнила выравнивания в трех программах: T-coffee, MAFFT и Muscle.Ссылка на проект со всеми выравниваниями.

Во всех своих предыдущих работах, где требовалось строить выравнивания, я пользовалась программой MAFFT. Эта программа подходит для выравнивания как аминокислотных последоваттельностей, так и нуклеотидных.
Сейчас я хочу сравнить выранивания построенные в программах T-coffee и Muscle. T-coffee способна анализировать не только последовательности, но и 3D структуры белков или нуклеиновых кислот. Muscle - одна из самых используемых на данный момент программ. В осенове ее алгоритма лежит постепенное улучшение изначально построенного чернового варианта множественного выравнивания.

На рисунке 1 и 2 представлены выравнивания (далее al1 и al2) сделанные в программах T-coffee и Muscle соответственно.


Рис.1


Рис.1

Различия в выравниваниях:

  1. Индель в начале всех последовательностей кроме первой. В al1 индель имеет длину 5 гэпов, в al2 - 2 гэпа, а дальше последовательности выравниваются по-разному. Благодаря разной длине инделя в начале в пзиции 7 для первых трех последовательности ставится остаток Т, в 9 - L.
  2. Для al1 - с позици 25 по 27 наблюдается попытка посторить блок из трех аминокислотных остатков. В него объеденены в основном алифатические остатки, но оказываются влючены два P и один ароматический Y, и из первой последовательности в него входят LPA. В al2 этот блок строится на основании остатков LAL из первой последовательности, во второй, третьей и шестой последовательностях блок смещен на однин аминокислотный остаток ближе к началу последоваттельности. Таким образом в него входит только один пролин, все остальные - алифатические аминокислотные остатки.
  3. В позициях 27-29 в al2 вставлен индель, чего не было для al1. Благодаря этому в al2 выравнены остатки A в позиции 26 и сопоставлены остатки P и V в позиции 25.

Кроме того приведу сравнение двух выравниваний по следующим пунктам, собранным в таблицу 1.

Таблица 1. Сравнение выравниваний.

Программа Длина выравнивания(max и min) Абсолютно консервативные позиции % Функционально консервативные позиции %
T-coffee 241, 176 16 6.64 29 12.03
Muscle 233, 169 17 7.30 31 13.30

Из данных таблицы видно, что процент абсолютно консервативных и функционально консервативных позиций выше для al2, причем это достигается за счет уменьшения максимальной длины выравнивания и увеличением количества кончервативных позиций.

Доменная архитектура.

Для выполнения этого задания я использовала белок Epidermal growth factor receptor (ID:EGFR_HUMAN). Я уже работала с ним в предыдущих практикумах.Это трансмембранный белок, он является рецептором для внеклеточных белковых лигандов из семейства фактора эпидермального роста - белков, отвечающих за рост, пролиферацию и дифференциацию клеток.[1]

В базе данных о семействах доменов Pfam я нашла домены этого рецептора. Они показаны на рисунке 3 и называются соответственно: Recep L domain(два зеленых блока), Furin-like, GF recep IV и Pkinase_Tyr.


Рис.3

Обратим внимание на домен Pkinase Tyr (PF07714). Это Тирозин киназа - подкласс класса протеиновых киназ. Данных фермент переносит фосфатную группу с молекулы АТФ на белки клетки. Он функционирует как регулятор множества внутриклеточных реакций. Основное отличие от других киназ заключается в присоединении фосфатной группы при переносе к остатку тирозина. [2]

Я рассмотрела три наиболее часто встречающиеся доменные архитектуры, в которые входит рассмотренный домен.

  1. Просто домен Pkinase Tyr, располагающийся в 88-345 позициях последовательности.


    Рис.4

  2. Доменная архитектура, состоящая из Malectin like - связывающий углеводы белок, встречающийся в киназах у некоторых растений, находится в позициях 29-338; домен Pkinase Tyr в позициях 541-809. Эти два домена разделены трансмембранным участком последовательности.


    Рис.5

  3. Доменная архитектура, состоящая из SH3 domain - домен, встречающийся в белках сигнальныхз путей в клетке - на позициях 76-123; SH2 domain - домен, позволяющий белкам, содержащим его, связываться с фосфорилированным остатком тирозина на другом белке, позиии 137-219; домен Pkinase Tyr, позиции 256-505.


    Рис.6

Источники

1. Epidermal growth factor receptor - wikipedia.org
2. Tyrosine kinase - Wikipedia article


© Юдина Анастасия, 2016