Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2024

Пояснения

Терминология

Блок определяется подмножеством последовательностей и участком от позиции S (start) до позиции E (end) выравнивания. Если подмножество содержит K последовательностей соберем их в выравнивании сверху. Блок задаётся так: (i) перечислением последовательностей (удобно их собрать так, чтобы шли сверху с первой по K-ю); (ii) участком позиции от S-той до E-той подряд.

Блок без гэпов это блок, в выравнивании которого нет НИ ОДНОГО гэпа

Уточнение Колонки блока, в которых нет ни одной буквы — только символы гэпа — не в счёт!

В полном выравнивании их не может быть (за бессмысленностью).

В блоке, содержащем не все последовательности, они могут появиться.

Проверка.

  1. Выделите блок мышью
  2. Правая кнопка мыши Selection → Output to textbox → fasta → New window (предыдущее окно можно закрыть)
  3. Меню Edit → Remove empty columns.

Блок достоверный, т.е. можно считать, что выравнивание в нем соответствует эволюционному, если:

  1. он без гэпов;
  2. первая позиция блока консервативна или функционально консервативна в блоке (а не во всем выравнивании);
  3. то же условие на последнюю позицию блока.

Чем больше консервативных позиций в блоке, и чем чаще они идут в блоке, тем достоверность блока выше. Консервативность бывает абсолютной — одна и та же буква в колонке, и функциональной — все а.к.о. в колонке принадлежат одной группе по свойствам. Например [ST], [KR], [ED], [FYW], [LIVM] и др. Группы не абсолютны, их можно переопределять. В первом приближении: буквы образуют группу, если для каждой пары букв вес из матрицы BLOSUM62 положительный.

Достоверный блок максимален если:

  1. нельзя добавить последовательность к блоку так, чтобы не уменьшить его достоверность;
  2. нельзя расширить его с N- или C-конца так, чтобы не уменьшить его достоверность.

JalView методы

У нас в JalView открыто выравнивание. Как:

Перемещать последовательности вверх/вниз

Выделить их и двигать стрелками вверх или вниз

Разбить последовательности на подмножества

выделить несколько соседних колонок, можно не подряд; Select => Make groups for selection; Calculate => Sort => by groups

Покрасить подмножество последовательностей

Выделить его; правой кнопкой selection; create group; повторить и выбрать Edit group => Color

Подмножество сохранить в отдельном окне

Выделить его; правой кнопкой selection; Output to text box => fasta; New window (предыдущее можно закрыть)

Как дублировать исходное окно для манипуляций

Так же: выделить всё Ctrl-a; правой кнопкой мыши Selection; Output to text box => Fasta; New window (предыдущее можно закрыть)

Перевыровнять последовательности в окне

Edit => Remove all gaps; Web service => Alignment, выбрать программу. Mafft — самый быстрый сервис, другие имеют свои преимущества

(О других возможностях см. здесь).

Для поиска блоков поиграйте с раскраской разными способами.

  1. Первый выбор Color => Clustal. В этой раскраске сходные по свойствам а.к. красятся в один цвет

  2. Важная возможность Color => Above identity threshold (и modify identity threshold)

  3. Сначала установите порог identity равным 100%. Увидите абсолютно консервативные позиции (одна и та же а.к. у всех последовательностей), если они есть
  4. Снижайте порог и наблюдайте.

2024/2/pr11/hints (последним исправлял пользователь sas 2025-04-29 13:25:08)