Учебная страница курса биоинформатики,
год поступления 2014
Несколько замечаний по миниобзорам на будущее
ААл
Про вероятность
- Вопрос, на который может дать ответ статистика:
На одной цепочке хромосомы закодировано 1400 генов, на комплементарной - 1350. Противоречит ли такое распределение генов предположению, что гены на цепочках распределены случайно с вероятностью 0.5 и независимо друг от друга?
"Независимо" значит как при бросании монетки много раз: если выпала решка, то нет никаких оснований предполагать, что это повлияет на вероятность выпадения решки при следующем бросании. Для генов предположение о независимости может быть не выполненным из-за существования оперонов: если группы каких-то генов располагаются в одном опероне, то знание о том, на какой цепочке расположен первый, определеяют цепочку для следующих генов оперона.
- Расчет вероятности наблюдаемого события при нашей гипотезе. (Гипотеза: гены на цепочках распределены случайно с вероятностью 0.5 и независимо друг от друга).
Вероятность того, что число генов на цепочке меньше или равно 1350, вычисляется, и она равна 0.17.
Важно, что мы выбрали меньшее из чисел 1350 и 1400. Догадались почему?
- Ответ, который дает статистика:
Выберем уровень доверия, например, p=0.05. Это значит, что если мы наблюдаем событие, вероятность которого больше порога, то считаем, что нет оснований сомневаться в нашей гипотезе. 0.17 > 0.05, поэтому набюлюдаемое распределение генов не противоречит гипотезе о независимом случайном распределении генов по цепочкам.
"Не противоречит" и "доказывает" - не одно и то же!
- Как написать в обзоре:
Вероятность того, что из 2750-и генов на одной цепочке обнаружено 1350 или меньше, равна 0.17, что не противоречит предположению о случайном независимом распределении генов по цепочкам при уровне доверия 0.05
Про содержание
Название "Обзор протеома бактерии ..." предполагает, что написано про бактерию, а не про автора. Поэтому фраза Цель состояла в том, чтобы овладеть Excel и ей подобные выглядит странно ...
- "Результаты" должны содержать результаты, а "Обсуждение" - обсуждение полученных результатов, а не их пересказ. В этом разделе можно высказывать свои соображения и гипотезы.
Про терминологию
Термин квазиоперон придумал то ли Русинов, то ли я - забыл кто. Предложенное определение квазиоперона не являтся гарантией того, что каждый квазиоперон является в действительности опероном. Можно утверждать только, что оперон бактерии должен содержаться в квазиопероне.
Про оформление
- Ссылка на сайт в списке литературы:
- НЕПРАВИЛЬНО:
[1] ftp://ftp.ncbi.nlm.nih.gov/genomes/Bacteria/Picrophilus_torridus_DSM
- ПРАВИЛЬНО:
[1] NCBI, полный геном P.torridus: ftp.ncbi.nlm.nih.gov/genomes/Bacteria/Picrophilus_torridus
- В "Резюме/Аннотации" НЕ МОЖЕТ БЫТЬ сносок. Дело в том, что аннотации собираются в специальных базах данных отдельно от текста статьи. Поиск по аннотациям помогает найти статью, истересующую читателя.
- В "Резюме/Аннотации" не стоит описывать методы, кроме случаев, когда эти методы оригинальны. Важна тема и результаты.
- НЕДОПУСТИМО приводить числа с 9-ю значащими цифрами (плохой пример из миниобзора: 0,362305357). Такая точность измерения бывает, разве что, в некоторых разделах физики. В биологии обычно достаточно двух значащих цифр, т.к. ошибки измерений велики.