Учебная страница курса биоинформатики,
год поступления 2014
Метод главных компонент в применении к выравниванию
Между каждой парой последовательностей вычисляется расстояние. Это расстояние пересчитывается из веса выравнивания. Чем более сходны последовательности, тем БОЛЬШЕ вес, а расстояние между ними должно быть МЕНЬШЕ. Придумайте сами разумную функцию для пересчета веса в расстояние.
Задача состоит в том, чтобы каждую последовательность представить точкой в 3х-мерном пространстве так, чтобы рассстояние между точками как можно точнее отрадало бы расстояние между последовательностями. Конечно, сохранить расстояния в точности невозможно. Математически задача такая. Можно представить последовательности точками в МНОГОМЕРНОМ прлостранстве так, чтобы расстояния сохранились в точности. Надо найти такую 3х-мерную плоскость в этом многомерном пространстве, чтобы проекции точек на эту плоскость наилучшим образом отражали расстояния между точками. При проекции, конечно, расстояния искажаются.
Остается придумать критерий, который позволяет сравнивать настоящие расстояния и расстояния между проекциями. И найти оптимальную 3х-мерную плоскость. Обе эти задачи решаются математически. Результат выдается в окошке JalView