Гомология и выравнивание


Описание семейства

Я выбрала семейство CoV_S2. AC семейства – PF01601, название – Coronavirus spike glycoprotein S2 (коронавирусный спайк-гликопротеин S2). Число последовательностей в seed равно 37, в full – 86. Число доменных архитектур – 10.

Спайк-гликопротеин S2 образуется в результате расщепления гликопротеина S на S1 и S2. Субъединица S1 прикрепляет вирус к рецептору поверхности клетки-хозяина, а трансмембранная субъединица S2 беспечивает слияние мембран вируса и клетки-хозяина.

Домен встречается только у вирусов (коронавирусы и Tobaniviridae)

Описание выравнивания seed с точки зрения гомологичности всех последовательностей или их подмножества

Ссылка на выравнивание последовательностей seed с окраской по проценту идентичности

Имеется 2 максимальных достоверных блока, содержащих все последовательности: 313-353 и 366-401. В них не содержится гэпов, первая и последняя позиции функционально консервативны (достоверные блоки с полностью консервативными первой и последне позициями отсутствуют). В первом содержится 9 позиций с достоверностью более 90%, а во втором – 8. Эти участки отражают гомологию белков и, видимо, являются важными для них, так как являются достаточно консервативными для всех белков.

блоки
Рис 1. Максимальные достоверные блоки, содержащие все последовательности

Для следующих последовательностей

выборка
Рис 2. Подмножество последовательностей

имеется максимальныйй достоверный блок на участке 417-456. На этом участке содержатся гэпы, но они содержатся на одинаковых позициях у всех последовательностей и образуют пустые столбцы, поэтому не считаются. В нём содержится 13 позиций с идентичностью более 90%. Также для этого подмножества есть максимальный достоверный блок на позициях 513-563 с 11 столбцами с идентичностью более 90%. Эти участки тоже отражают гомологию белков, однако, вероятно, являются менее важными, так как консервативны не для всех белков.

Участки без достоверных блоков, вероятно, находятся, например, на позициях 90-100, 291-308 и 604-619. На этих участках практически не содержится позиций с идентичностью более 30%, а также присутствует много гэпов. Эти участки не отражают гомологию.