Блоки во множественных выравниваниях



Поиск гомологов TrmB в Swiss-Prot

Для поиска блоков в выравнивании был выбран домен N-концевой домен белков Cas6 (ID: CRISPR_Cas6_N; AC: PF19308). В выравнивании seed этого домена присутствует 39 последовательностей, а в выравнивании full – 174. В исследуемом выравнивании (seed) отмечены 3 блока (Табл. 1) и составлены паттерны для их поиска. Условия паттернов основаны на свойствах аминокислот. Здесь поиск осуществляется по 4 группам: неполярные, полярные незаряженные, положительно заряженные полярные и отрицательно заряженные полярные. В случае высокой консервативности конкретного остатка, в паттерне на соответствующей позиции указывался только он. Стоит отметить, что для вертикального плюс-блока по паттерну находится малая часть последовательностей из-за большой длины этого блока (многие последовательности не находятся из-за единичных замен).

Проект Jalview с выравниванием.

Таблица 1. Параметры юлоков в выравнивании
Блок Координаты Паттерн
Вертикальный плюс-блок 1-45 MP[HY]SL[VI][LFVI][NTK][LFI][LMVI]P.S[PA][IV].[PLVA].[YF]L[STNQ]G[RKH]H[LVY][HY][AG]LF[LF][TSNQDE][LM][VI][TSNQ][TSNQ]V[DN]..L[GA]..LH
Частичный плюс-блок 46-49 [DE][STQN][STQN]A
Минус-блок 61-115 Отсутствует