Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2014

Метод главных компонент в применении к выравниванию

Между каждой парой последовательностей вычисляется расстояние. Это расстояние пересчитывается из веса выравнивания. Чем более сходны последовательности, тем БОЛЬШЕ вес, а расстояние между ними должно быть МЕНЬШЕ. Придумайте сами разумную функцию для пересчета веса в расстояние.

Задача состоит в том, чтобы каждую последовательность представить точкой в 3х-мерном пространстве так, чтобы рассстояние между точками как можно точнее отрадало бы расстояние между последовательностями. Конечно, сохранить расстояния в точности невозможно. Математически задача такая. Можно представить последовательности точками в МНОГОМЕРНОМ прлостранстве так, чтобы расстояния сохранились в точности. Надо найти такую 3х-мерную плоскость в этом многомерном пространстве, чтобы проекции точек на эту плоскость наилучшим образом отражали расстояния между точками. При проекции, конечно, расстояния искажаются.

Остается придумать критерий, который позволяет сравнивать настоящие расстояния и расстояния между проекциями. И найти оптимальную 3х-мерную плоскость. Обе эти задачи решаются математически. Результат выдается в окошке JalView