Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2025

Практикум 8

  1. Следует сделать Google doc со всеми разделами, перечисленными в задании — от названия обзора до списка литературы.

    1. В раздел "Результаты" следует включить подраздел "Гистограмма длин белков" и поместить в него рисунок с гистограммой построенной в задании 7_home. Правильной, а то видал и ошибки при вычислении гистограммы. Правильная выглядит как горбик: мало коротких и мало длинных а между ними горбик. И пара фраз про то, что видно на гистограмме.
    2. В раздел "Введение" следует включить таксономию вида вашей бактерии. Ищите её по латинскому названию в NCBI Taxonomy. Напишите примерно такую фразу во введении "Таксономия моей бактерии: ..... (ссылка на страницу, откуда взята информация)".
    3. Кроме Гистограммы длин белков для зачёта пр. 8_home следует выполнить ещё ОДНО задание из списка. Самые простые, по моему, такие:
      • 3.8 hist_GC% в генах. Такой столбец есть в Feature_table
      • 3.3 inter_CDS_his гистограмма межгенных промежутков
      • 3.4 intersecting_CDS_hist. Некоторые гены белков (CDS) могу пересекаться, что само по себе интересно.Почему? Ведь ДНК зависимые РНК полимеразы могут сталкиваться при их трансляции. Я бы отключил огаричения, написанные в задании, и брал гены на обеих цепочках независимо от того в какую сторону они направлены.При сортировке по началу генов. Это те гены, у которых конец предыдущего больше начала следующего.Потом можно будет развить эту тему
      • 3.12 Вычислить процент суммы длин CDS от длины репликона. Репликон — это одна ДНК, реплицирующаяся отдельно от других, то есть хромосома или плазмида.

Выполненное ещё одно задание (кроме обязательного — гистограммы длин белков), можно будет включить в отдельный раздел обзора. Пока можно просто поставить на свою wiki-страницу) ссылку на книгу, в котрой представлен результат.

Необходимое и достаточное для зачёта за блок 3

  1. Документ с таблицами, каждая на своей странице (пр. 8_class)
    1. Feature table без незначимых колонок, и числами как числа, а не как текст (пр. 7_home)
    2. genes — список всех генов
    3. CDS_with_proteins
    4. CDS_without_proteins
  2. Страница с гистограммой длин белков (числами и столбчатой диаграммой)
  3. Страница с ещё одним заданием из списка
  4. Google doc с разделами (пр. 8_home)

Настаиваю на выполнении пр. 8_class задание 1, на совмещение двух таблиц с информацией о ДНК метилтрансферазах с помощью VLOOKUP (ВПР). По жизни очень нужная функция. В силу сложившихся обстоятельств в зачёт блока её не включил, но баллы за неё идут. Срок сдачи не важен.

2025/1/hints8 (последним исправлял пользователь sas 2025-11-06 11:51:24)