Учебная страница курса биоинформатики,
год поступления 2013
Задание
1. (1 балл) Сгенерируйте случайно 3 выборки данных размера 500 каждая (наличие или отсутствие зависимости между ними остается на ваше усмотрение, разрешается генерировать их не совсем случайно) и постройте scatter plot для зависимости первой от второй, и сохраните в файл гистограмму распределения значений третьей.
2.1 (2 балла) Даны частоты гомо- и гетеро- зиготных особей для некоторых мутаций среди африканской популяции.
Постройте два графика: scatter plot зависимости частоты гомозигот по альтернативному аллелю от гетерозигот на одном (оси подписать, добавить легенду) и две гистограммы распределения частоты особей для каждого типа зиготности на другом.
2.2 (3 балла) Данные те же, что и в 2.1
Существует закон Харди-Вайнберга (https://ru.wikipedia.org/wiki/%D0%97%D0%B0%D0%BA%D0%BE%D0%BD_%D0%A5%D0%B0%D1%80%D0%B4%D0%B8_%E2%80%94_%D0%92%D0%B0%D0%B9%D0%BD%D0%B1%D0%B5%D1%80%D0%B3%D0%B0), устанавливающий соотношение гомо- и гетеро- зигот в популяции в зависимости от частоты одного из аллелей.
К scatter plot добавьте график, отображающий соотношения, которые бы наблюдались в случае 100% выполнения этого закона. Для этого для равномерного набора частот одного аллеля от 0 до 1 рассчитайте (программно) возможные частоты гомо- и гетеро- зигот, и постройте их вторым графиком к существующему scatter plot. Подпишите график и оси, ограничьте график по обоим осям интервалом от 0 до 1. Картинку сохраните в файл.
Сравните между собой теоретические и практические соотношения особей. Как вы думаете, что означают выпадающие из теоретического графика точки?