Учебная страница курса биоинформатики,
год поступления 2018
Обработка таблицы генов бактерии — подготовка результатов для мини-обзора генома
Обязательные задания
На отдельном листе создать сводную таблицу, в которой для каждого сочетания значений в колонках #features (A) и class (B) посчитано число строк с такими значениями. Эта таблица имеет техническое значение. Она нужна для отбора строк, описывающих полноценные гены белков, строк, описывающих псевдогены, и строк, описывающих гены РНК. См. подсказки.
- Построить гистограмму длин белков своей бактерии/археи. Описать статистику длин: минимум, максимум, средняя длина, среднеквадратичное отклонение от среднего (называется также СТАНДАРТНОЕ ОТКЛОНЕНИЕ), медиана.
- Создать таблицу числа генов белков, псевдогенов и генов РНК на прямой и комплементарной цепи ДНК (три строки и четыре столбца, включая заголовки строк и столбцов).
Дополнительные задания
- Проверьте гипотезу о том, что гены в геноме распределены по двум цепям ДНК случайно и равновероятно.
- Посчитайте, сколько "квазиоперонов" в геноме вашей бактерии или археи. "Квазиопероном" назовем максимальную последовательность генов, закодированных на одной цепочке с промежутками между генами не более порога 100 п.н. (Квазиоперон может состоять и из одного гена.)
- Представьте статистические данные о пересечениях генов (если таковые обнаружатся).
- Другое, что придумаете в рамках доступных данных о вашем геноме.