Практикум №11
Выбор ID семейства белковых доменов
Я выбрал идентификатор домена - TFIIE-A_C, с 26 последовательностями в выравнивании и 4-мя структурами. Однако при работе в программе Jalview последовательностей оказалось меньше - 23. AC домена - PF11521, summary name - C-terminal general transcription factor TFIIE alpha.
Выравнивание белковых доменов
Ссылка на проект Jalview тут.
Описание выравнивания белковых доменов
Максимальным блоком достоверного выравнивания из всех последовательностей можно назвать блок, начинающийся с 82-го столбца и заканчивающийся 95-м столбцом. Замены M на L и Q на E положительны по таблице BLOSUM62. Такое же можно заявить про блок, начинающийся с 58-го столбца и заканчивающийся 72 столбцом, где замены (в некоторых последовательностях) P на S, M, T и H отрицательны, а замены V на M, L и I положительны.
Если рассматривать фрагменты не из всех последовательностей, то максимальный блок достоверного выравнивания - это, например, блок с 43 по 75 позиции среди 10 последовательностей. В целом блок консервативен, хотя и имеются некоторые отрицательные замены по матрице BLOSUM62.
Участок выравнивания, не отражающий ход эволюции, располагается между 20 и 42 позициями. Почти у всех белков здесь располагаются длинные индели, и только у некоторых сохраняется аминокислотная последовательность.
Ссылка на заполненную таблицу Excel тут.