Выбор был проведен случайно.В разделе семейств была выбрана буква А и найдено семейство AGS_C.Он превышал число последовательностей по выборке full (240 вместо 200),но как я посчитала незначительно.
Была построена карта локального сходства для белков с наиболее представлеными доменными архитектурами(представлены выше)
Видно, что произошла делеция в 2-3 аминокислоты.
Для начала были убраны протеом с совпадениями свыше 97%,таким образом количество с 240 снизилось до 223.Далее они были разделены по группам методом дерева,получилось всего пять.Рассмотрим две самые крупные - отмечены белым и бежевым цветом.
Колонка | 80 | 87 | 165 | 174-176 | 259 | 262 | 274-276 |
---|---|---|---|---|---|---|---|
Группа 1(белый) | I | V | Y | Много W,V | V | V | Много V,A,R |
Группа 2(желтый) | F | F | L | Много F,I | M | Y | Много L,F,S |
Ссылка на выравнивание в Jalview .
По запросу database:(type:pfam PF18134) были найдены белки семейства и создана таблица с требуемыми данными.
Ссылка на таблицу.