Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2024

Содержание мини-обзора генома бактерии

В мини-обзоре должны присутствовать:

Варианты заданий

  1. Обязательное (гистограмма длин белков),
  2. Составьте таблицу числа генов белков и генов разных типов РНК для каждого репликона (репликон указан в столбце chromosome таблицы особенностей)
  3. Постройте гистограммы длин промежутков между кодирующими последовательностями (CDS)
  4. Выберите кодирующие последовательности (CDS) на плюс-цепи самой большой хромосомы такие, которые пересекаются со следующей CDS на плюс-цепи и вычислите число нуклеотидов в пересечении. То же для минус-цепи. Укажите, сколько CDS пересекается со следующей CDS на той же цепи, какой процент это число составляет от числа всех CDS на хромосоме. Постройте гистограмму длин пересечений.
  5. Определите все старт-кодоны (первые кодоны) в кодирующих последовательностях (CDS) и вычислите, сколько раз встречается каждый старт-кодон; отдельно во всех CDS, псевдогенах и "нормальных" генах.
  6. Определите все стоп-кодоны в кодирующих последовательностях (CDS) и вычислите, сколько раз встречается каждый стоп-кодон. Желательно тоже отдельно для псевдогенов и нормальных генов.
  7. Постройте гистограмму GC-состава (GC%) по CDS
  8. Исследуйте проценты нуклеотидов A, T, G, C по репликонам
  9. Исследуйте частоты динуклеотидов по репликонам. Динуклеотид — это два нуклеотида подряд.
  10. Сравните свой геном с геномами других штаммов того же вида или рода по каким-нибудь характеристикам (например, по длинам репликонов, числу CDS, средней длине белка и т.п.)
  11. Создайте таблицу процентов длины, занятой генами белков, генами РНК, псевдогенами и межгенными промежутками, для каждого репликона.
  12. Создайте таблицу 3✕3, первая строка — с заголовками столбцов, первый столбец — с названиями строк, а в четырёх ячейках — числа:

    • CDS на плюс-цепи таких, что следующая CDS — тоже на плюс-цепи
    • CDS на плюс-цепи таких, что следующая CDS — на минус-цепи
    • CDS на минус-цепи таких, что следующая CDS — на плюс-цепи
    • CDS на минус-цепи таких, что следующая CDS — тоже на минус-цепи

(в простейшем варианте можно просто проанализировать столбец "strand" для CDS, с учётом хромосомы; более правильный и сложный вариант предусматривает проверку того, что между CDS не вклинились гены РНК или псевдогены)

2024/1/mini_review_tasks (последним исправлял пользователь sas 2024-11-29 10:02:50)