Для поиска блоков в выравнивании был выбран домен N-концевой домен белков Cas6 (ID: CRISPR_Cas6_N; AC: PF19308). В выравнивании seed этого домена присутствует 39 последовательностей, а в выравнивании full – 174. В исследуемом выравнивании (seed) отмечены 3 блока (Табл. 1) и составлены паттерны для их поиска. Условия паттернов основаны на свойствах аминокислот. Здесь поиск осуществляется по 4 группам: неполярные, полярные незаряженные, положительно заряженные полярные и отрицательно заряженные полярные. В случае высокой консервативности конкретного остатка, в паттерне на соответствующей позиции указывался только он. Стоит отметить, что для вертикального плюс-блока по паттерну находится малая часть последовательностей из-за большой длины этого блока (многие последовательности не находятся из-за единичных замен).
Проект Jalview с выравниванием.
Блок | Координаты | Паттерн |
---|---|---|
Вертикальный плюс-блок | 1-45 | MP[HY]SL[VI][LFVI][NTK][LFI][LMVI]P.S[PA][IV].[PLVA].[YF]L[STNQ]G[RKH]H[LVY][HY][AG]LF[LF][TSNQDE][LM][VI][TSNQ][TSNQ]V[DN]..L[GA]..LH |
Частичный плюс-блок | 46-49 | [DE][STQN][STQN]A |
Минус-блок | 61-115 | Отсутствует |