Пояснения
Терминология
Блок определяется подмножеством последовательностей и участком от позиции S (start) до позиции E (end) выравнивания. Если подмножество содержит K последовательностей соберем их в выравнивании сверху. Блок задаётся так: (i) перечислением последовательностей (удобно их собрать так, чтобы шли сверху с первой по K-ю); (ii) участком позиции от S-той до E-той подряд.
Блок без гэпов это блок, в выравнивании которого нет НИ ОДНОГО гэпа
Уточнение Колонки блока, в которых нет ни одной буквы — только символы гэпа — не в счёт!
В полном выравнивании их не может быть (за бессмысленностью).
В блоке, содержащем не все последовательности, они могут появиться.
Проверка.
- Выделите блок мышью
- Правая кнопка мыши Selection → Output to textbox → fasta → New window (предыдущее окно можно закрыть)
- Меню Edit → Remove empty columns.
Блок достоверный, т.е. можно считать, что выравнивание в нем соответствует эволюционному, если:
- он без гэпов;
- первая позиция блока консервативна или функционально консервативна в блоке (а не во всем выравнивании);
- то же условие на последнюю позицию блока.
Чем больше консервативных позиций в блоке, и чем чаще они идут в блоке, тем достоверность блока выше. Консервативность бывает абсолютной — одна и та же буква в колонке, и функциональной — все а.к.о. в колонке принадлежат одной группе по свойствам. Например [ST], [KR], [ED], [FYW], [LIVM] и др. Группы не абсолютны, их можно переопределять. В первом приближении: буквы образуют группу, если для каждой пары букв вес из матрицы BLOSUM62 положительный.
Достоверный блок максимален если:
- нельзя добавить последовательность к блоку так, чтобы не уменьшить его достоверность;
- нельзя расширить его с N- или C-конца так, чтобы не уменьшить его достоверность.
JalView методы
У нас в JalView открыто выравнивание. Как:
Перемещать последовательности вверх/вниз |
Выделить их и двигать стрелками вверх или вниз |
Разбить последовательности на подмножества |
выделить несколько соседних колонок, можно не подряд; Select => Make groups for selection; Calculate => Sort => by groups |
Покрасить подмножество последовательностей |
Выделить его; правой кнопкой selection; create group; повторить и выбрать Edit group => Color |
Подмножество сохранить в отдельном окне |
Выделить его; правой кнопкой selection; Output to text box => fasta; New window (предыдущее можно закрыть) |
Как дублировать исходное окно для манипуляций |
Так же: выделить всё Ctrl-a; правой кнопкой мыши Selection; Output to text box => Fasta; New window (предыдущее можно закрыть) |
Перевыровнять последовательности в окне |
Edit => Remove all gaps; Web service => Alignment, выбрать программу. Mafft — самый быстрый сервис, другие имеют свои преимущества |
(О других возможностях см. здесь).
Для поиска блоков поиграйте с раскраской разными способами.
Первый выбор Color => Clustal. В этой раскраске сходные по свойствам а.к. красятся в один цвет
Важная возможность Color => Above identity threshold (и modify identity threshold)
- Сначала установите порог identity равным 100%. Увидите абсолютно консервативные позиции (одна и та же а.к. у всех последовательностей), если они есть
- Снижайте порог и наблюдайте.