Я выбрала семейство CoV_S2. AC семейства – PF01601, название – Coronavirus spike glycoprotein S2 (коронавирусный спайк-гликопротеин S2). Число последовательностей в seed равно 37, в full – 86. Число доменных архитектур – 10.
Спайк-гликопротеин S2 образуется в результате расщепления гликопротеина S на S1 и S2. Субъединица S1 прикрепляет вирус к рецептору поверхности клетки-хозяина, а трансмембранная субъединица S2 беспечивает слияние мембран вируса и клетки-хозяина.
Домен встречается только у вирусов (коронавирусы и Tobaniviridae)
Ссылка на выравнивание последовательностей seed с окраской по проценту идентичности
Имеется 2 максимальных достоверных блока, содержащих все последовательности: 313-353 и 366-401. В них не содержится гэпов, первая и последняя позиции функционально консервативны (достоверные блоки с полностью консервативными первой и последне позициями отсутствуют). В первом содержится 9 позиций с достоверностью более 90%, а во втором – 8. Эти участки отражают гомологию белков и, видимо, являются важными для них, так как являются достаточно консервативными для всех белков.
Для следующих последовательностей
имеется максимальныйй достоверный блок на участке 417-456. На этом участке содержатся гэпы, но они содержатся на одинаковых позициях у всех последовательностей и образуют пустые столбцы, поэтому не считаются. В нём содержится 13 позиций с идентичностью более 90%. Также для этого подмножества есть максимальный достоверный блок на позициях 513-563 с 11 столбцами с идентичностью более 90%. Эти участки тоже отражают гомологию белков, однако, вероятно, являются менее важными, так как консервативны не для всех белков.
Участки без достоверных блоков, вероятно, находятся, например, на позициях 90-100, 291-308 и 604-619. На этих участках практически не содержится позиций с идентичностью более 30%, а также присутствует много гэпов. Эти участки не отражают гомологию.