Исходя из ограничений выбрала семейство Scorpion toxin-like domain (ID: Toxin_3; AC: PF00537).
Число последовательностей в выборке seed: 33
Число последовательностей в выборке full: 147
Число доменных архитектур: 8
Число 3D структур: 74
Число белков в Swiss-Prot: 423
Таксономическая распространенность
Семейство встречается только у Эукариот (Eukaryota). Metazoa: 75,4% последовательностей, Viridiplantae: 24,6% последовательностей.
Функции белков в семействе
Семейство включает в себя нейротоксины и дефензины (короткие и богатые цистеином пептиды, которые нужны для защиты от патогенов) растений. Например, токсин скорпиона (нейротоксин) связывается с натриевыми каналами и ингибирует механизмы их активации, тем самым блокируя передачу в нейронах.
Описание выравнивания seed с точки зрения гомологичности всех последовательностей или их подмножества
Максимальный достоверный блок, включающий все последовательности: 55-57, консервативные во всех последовательностях одиночные аминокислоты: 19, 28, 32.
Далее выделила 41 и 43 колонку, отсортировала последовательности по ним (select => make groups for selection; calculate => sort = by groups). Получила максимальный достоверный блок, не включающий все последовательности: 41-43.
Участок выравнивания (включающий все последовательности), в котором нет никаких достоверных подблоков: 29-31.
Вывод: выравнивание позволяет судить о голомологии последовательностей в основном в их начале (там также можно выделить максимальный достоверный блок, включающий не все последовательности) и конце.
Карта локального сходства (dotplot) двух последовательностей с одним и тем же доменом, но с разной доменной архитектурой
Выбрала доменную архитектуру PF00537 (AC белка: A0A078FTS2, последовательность 1) и доменную архитектуру PF00537 - PF00537 (AC белка: A0A816J5J7, последовательность 2) . Белки из одного организма Brassica napus (Rape) .
На рисунке 2 видим, что нижняя линия имеет одну прерывистость, это соответствует гэпам в последовательности 1. Мы видим 2 линии, так как последовательность архитекутры PF00537 выравнивается 2 раза на архитектуру PF00537 - PF00537 (так как вторая 2 раза повторяет первую).