Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2018

Обработка таблицы генов бактерии — подготовка результатов для мини-обзора генома

Обязательные задания

  1. На отдельном листе создать сводную таблицу, в которой для каждого сочетания значений в колонках #features (A) и class (B) посчитано число строк с такими значениями. Эта таблица имеет техническое значение. Она нужна для отбора строк, описывающих полноценные гены белков, строк, описывающих псевдогены, и строк, описывающих гены РНК. См. подсказки.

  2. Построить гистограмму длин белков своей бактерии/археи. Описать статистику длин: минимум, максимум, средняя длина, среднеквадратичное отклонение от среднего (называется также СТАНДАРТНОЕ ОТКЛОНЕНИЕ), медиана.
  3. Создать таблицу числа генов белков, псевдогенов и генов РНК на прямой и комплементарной цепи ДНК (три строки и четыре столбца, включая заголовки строк и столбцов).

Дополнительные задания

  1. Проверьте гипотезу о том, что гены в геноме распределены по двум цепям ДНК случайно и равновероятно.
  2. Посчитайте, сколько "квазиоперонов" в геноме вашей бактерии или археи. "Квазиопероном" назовем максимальную последовательность генов, закодированных на одной цепочке с промежутками между генами не более порога 100 п.н. (Квазиоперон может состоять и из одного гена.)
  3. Представьте статистические данные о пересечениях генов (если таковые обнаружатся).
  4. Другое, что придумаете в рамках доступных данных о вашем геноме.