Учебная страница курса биоинформатики,
год поступления 2024
Нам желательно, чтобы задания по блоку 3 почти не накладывлись на задания по программированию. Поэтому ставлю deadline без потери баллов для всех обязательных зданий (см. ниже) в ведомости ставлю на ночь с воскресенья на понедельник
Практикум 8
- Следует сделать Google doc со всеми разделами, перечисленными в задании - от названия обзора до списка литературы.
- В раздел Результаты следует включить подраздел Гистограмма длин белков и поместить в него рисунок с гистограммой построенной в задании 7_home. Правильной, а то видал и ошибки при вычислении гистограммы. Правильная выглядит как горбик: мало коротких и мало длинных а между ними горбик. И пара фраз про то, что видно на гистограмме
В раздел Введение следует включить таксономию вида вашей бактерии. Обычно есть в wiki. Напишите примерно такую фразу во введении "Таксономия моей бактерии: ..... [1]" В разделе Литература напишите [1] wikipedia страница https://en.wikipedia.org/wiki/......
- Кроме Гистограммы длин белков для зачёта пр.8_home следует выполнить ещё ОДНО задание из списка. Самые простые по моему, такие:
- 3.8 hist_GC% в генах. Такой столбец есть в Feature_table
- 3.3 inter_CDS_his гистограмма межгенных промежутков
- 3.4 intersecting_CDS_hist. Некоторые гены белков (CDS) могу пересекаться, что само по себе интересно.Почему? Ведь ДНК зависимые РНК полимеразы могут сталкиваться при их трансляции. Я бы отключил огаричения, написанные в задании, и брал гены на обеих цепочках независимо от того в какую сторону они направлены.При сортировке по началу генов. Это те гены, у которых конец предыдущего больше начала следующего.Потом можно будет развить эту тему
- 3.12 Вычислить процент суммы длин CDS от длины репликона. РЕПЛИКОН это одна ДНК, реплицирующаяся отдельно от других. Хромосома или плазмида или ещё что-нибудь.
Выполненное ещё одно задание (1е гистограмма длин белков), мошно включить в отдельный раздел обзор а можо и просто поставить ссылку на страницу на котрой представлен результат. Оформите обзор потом.
ДОСТАТОЧНО.
Зачёт блока 3
- Документ с таблицами, каждая на своей странице (пр.8_класс)
- Feature table без незначимых колонок, и числами как числа а не как текст (пр.7_home)
- genes - список всех генов
- CDS_with_proteins
- CDS_without_proteins. Как такое может быть? Зачем они бактерии?
- Страница с гистограммой длин белков и с рисунком её, вставленным потом в обзор.
- Google doc с разделами (пр.8_home)
- ТРИ ДОКУМЕНТА
- Настаиваю на выполнении пр.8_класс_задание 1. На совмещение двух таблиц с информацией о ДНК метилтрансферазах с помощью vlookup(ВПР). По жизни очень нужная функция. В силу сложившихся обстоятельств в зачёт блока её не включил, но баллы за неё идут. Срок сдачи не важен