Множественное выравнивание

C помощью Pfam я нашел домены белка AHPC_AMPXN. Я выбрал AhpC-TSA - наиболее длинный из доменов данного белка. Со страницы домена было скачано выравнивание seed 96 белков.
Далее количество белков было уменьшено в соответствии с заданием. (В основном - удалением последовательностей с крупными вставками или делециями, Remove redundancy не выявило последовательностей, сходных более чем на 90%, поэтому этот метод уменьшения числа последовательностей не использовался). Далее в выравнивании были выделены блоки (так, чтобы блок не содержал гэпов, имел много консервативных и функционально консервативных позиций).Скачать Jalview проект
almn1

  1. Блок 1 имеет длину 9 позиций, среди которых 2 консервативных позиции и 4 функционально-консервативных. На 2 позиции в двух последовательностях произошла замена лизина на глутамин, на 7 - аспарагиновой кислоты на аргинин и аланин
  2. Блок 2 имеет длину 8 позиций, среди которых 3 консеративных и 1 функционально-консервативная. Этот блок содержит 2 цистеина, поэтому можно предположить, что он играет важную роль в формировании структуры белка
  3. Блок 3 имеет длину 6 и в основном состоит из гидрофобных аминокислот, из чего можно предположить, что он играет роль в формировании гидрофобного центра, влияющего на структуру белка.
  4. Блоки 4 и 5 имеют длину 6 и 7 соответственно, я затрудняюсь сделать какие-то предположения о их значении.

Таким образом, в выравнивании мы видим много гомологичных блоков, расположенных недалеко друг от друга, из чего можно сделать вывод, что данные последовательности гомологичны.