Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2015

Словарь терминов (ЕА, ААл)

Тут приведен список терминов, которые употребляются в третьем блоке. Следует учитывать, что терминология в этой области науки не является общепринятой. Я предлагаю использовать эти слова в указанном здесь значении, тогда мы можем с вами понимать друг друга. Но это не значит, что все биоинформатики планеты Земля понимают эти термины именно так. В скобках приведены возможные альтернативные понимания. ЕА

Блок не может содержать гэпов, так как иначе у каких-то остатков нет гомологов в других последовательностях.

Блок не может быть коротким, так как совпадение коротких последовательностей может быть случайным. Для ориентировки: блок из пяти колонок с тремя абсолютно консервативными позициями и включающий более трех разных последовательностей уже можно считать достоверным. Точных критериев достоверности нет. В нашем курсе будем пользоваться следующим техническим определением:

Вертикальный блок это участок множественного выравнивания, обладающий следующими свойствами:
 
 a. Не содержит гэпов.
 b. Длина - не менее 4 колонок.
 c. Первая и последняя колонки - абсолютно консервативны или абсолютно функционально консервативны.
 d. Процент абсолютно консервативных колонок больше ... 35%
 e. Не содержит более .... 10  колонок, не являющихся абсолютно консервативными или абсолютно функционально консервативными, подряд.
 e. Не может быть расширен без нарушения предыдущих свойств.

Многоточие перед числами выражает мою неуверенность в их правильности. Дело в том, что точных оценок и нет. Нужен опыт. ААл

Чем длиннее блок, тем больше консервативных позиций в нем нужно найти, чтобы поверить в его достоверность (почему?).

Чем меньше последовательностей в блоке, тем больше консервативных позиций в нем нужно найти, чтобы поверить в его достоверность (почему?).