Блоки во множественном выравнивании

Я нашла в BLAST белки, предположительно гомологичные моему GCH4_NITEU и ограничила выдачу поиска 100 белками.
Файл с последовательностями найденных белков Я провела очистку множественного выравнивания от слишком похожих друг на друга последовательностей (порог процента схожести 90%), заменив их все одной, отсортировала последовательности в выравнивании по уменьшению их попарного сходства и удалила последовательности, сильно непохожие на другие. Затем я выделила блоки в выравнивании и их можно увидеть на изображениях или в проекте JalView.

this is the first block

Первым блоком я считаю участок с 23 по 40 аминокислоты, здесь 9 колонок полностью консервативны, а ещё три почти полностью консервативны, лишь по одной последовательности имеют отличные от остальных аминокислоты, и то замены почти синонимичные, валин вместо изолейцина, лейцин вместо валина, изолейцин вместо валина. Следующий блок начинается с 45 позиции и заканчивается 76, плотность консервативных колонок высока, между ними не больше двух колонок, в которых аминокислоты различаются и по ним можно выделить группы последовательностей: те, которые имеют на 61 позиции гистидин и аспартат на 62 и те, которые имеют глутамин и гистидин. 72 колонка почти консервативна, в ней гидрофобные валин, лейцин и изолейцин. Третий блок я пометила как начинающийся с 79 и заканчивающийся 94 колонками, в нём не полностью консервативных колонок всего пять, и даже в них для большинства последовательностец аминокислоты одни и те же. Замена аргинина на гистидин в 92 позиции сохраняет основность аминокислоты. Блок 4 со 106 по 135 колонки почти полностью состоит из консервативных колонок, а те из них, которые JalVIew не выделил синим, потому что счёл недостаточно консервативными, всё равно довольно схожи.

this is the second block

Пятый блок состоит из колонок 145-175 и почти весь ультра консервативен, за исключением 146 колонки с лейцином и валином и 165-165 колонок, аминокислоты в которых схожи для разных последовательностей. Шестой блок я выделила с позиции 203 по позицию 232, в нём лишь три колонки, в которых аминокислоты совпадают не для всех последовательностей, причём в одной из колонок валин стандартно заменился на изолейцин без особенных нарушений функций белка. Седьмой блок начинается с 240 и щаканчивается 267 позицией, в нём содержится внушительный участок, где совпадают сразу все последовательности. Проект JalView с размеченными блоками