Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2017

Мини-рецензии на мини-отчеты

Не ищите здесь рецензию на вашу работу. Здесь всего две реценции, на всех не хватает времени :(

Анастасия Болихова

Автор рецензии А.Алексеевский

Структура текста - как разбит на разделы, что написано в каждом раделе и в каком порядке, как представлены результаты - очень хорошая! (++) Одна ошибка - оформление ссылок на литературу (-). Посмотрите для примера статьи по биологии.

Замечания по результатам. Транспортные и рибосомальные РНК перепутаны в мат. и мет. (-)

>2000 генов тРНК в геноме бактрии - явная ошибка (--). Тем более, что в Табл 3 указано, что генов ВСЕХ РНК чуть больше ста.

"Это объясняется тем, что для синтеза обного белка необходима одна рибосома, состоящая из нескольких рРНК, и большое количество тРНК, а значит для функционирования клетке требуется большее количество тРНК, чем рРНК." Из контекста неясно речь идет о числе молекул в клетке или числе генов, кодирующих разные молекулы.

Обсуждение написано свободно, изложено Ваше понимание проблем (+). Есть неточности, но это не минус - пока Вы не все знаете.

Юлия Беляева

А.Алексеевский

Допустим, я хочу проверить Ваши результаты. Мне нужны данные, с которыми Вы работали. "Поиск и загрузка файла для работы с геномом исследуемой бактерии проводился с помощью NCBI. " Наверное, мне надо написать письмо в организацию NCBI (а где она?) и попросить, чтобы ее сотрудники прислали мне нужные данные???

"Для работы были использованы данные, полученные в ходе предыдущей работы"

Чтобы прочитать Ваш обзор не обязательно знать, что Вы делали ранее! (Сослаться на свою ранее опубликованную работу можно, но это не тот случай :) )

Раздел 2.2 не нужен! Это ненужные технические детали.

"Для определения числа генов белков каждой категории был использован фильтр по значению “CDS” (столбец A:A). Полу- ченная таблица была скопирована на другой лист рабочего файла."

Неуместные технические детали!

Второй раздел 2.2 (два раздела помечены как 2.2 :) ) нужно решительно сократить. Я бы написал примерно так:

Хромосомная таблица (см. лист .... в сопроводительном файле формата Excel) использовалась для подсчета числа генов по категориям. Гены белков соответствуют значениям CDS в колонке Class и .... в колонке Features Транспортные белки находились с дополнительным условием .... в колонке name. Гипотетические - .... Рибосомальные - ... Псевдогены ..... Гены РНК .... и т.д.

КОНЕЦ раздела.

2.3 Какой такой практикум 13? Вы пишете обзор НЕ ДЛЯ ПРЕПОДАВАТЕЛЯ, а для того, чтобы из него любой человек мог найти что-нибудь про геном описываемой Вами бактерии.

Ваш мини-обзор открыт в интернет. И, значит, школьник из милого Вам города Набережные Челны может его найти с помощью Google и прочитать. Попробуйте представить себя на месте этого школьника и пишите для него.

Это и есть круг потенциальных читателей Вашего обзора!

2.5

Не надо описывать результаты в этом разделе. Надо оставить вот что. Мною написан скрипт, который симулирует случайный выбор указанного числа генов на прямой или обратной цепочке.

Остальное, пожалуй, лучше перенести в результаты.

3.3. Похоже, все расчеты выполнены правильно, хотя результаты описаны плохо. НО ВЫВОД НЕПРАВИЛЬНЫЙ! Отклонение от ожидаемого числа 2785.5 генов на цепочке в Ваших данных равно 36.5.

ГИПОТЕЗА: гены СЛУЧАЙНО "выбирают" цепочку.

ВОПРОС: противоречит ли наблюдаемое в Вашем геноме отклонение 36.5 от ожидаемого гипотезе?

СИМУЛЯЦИЯ в предположении, что гипотеза верна, позволяет оценить ВЕРОЯТНОСТЬ того, что в одном случайно выбранном геноме, отклонение отклонение числа генов на одной цпочке от ожидаемого, окажется таким же, как в Вашем геноме, или больше.

Вы симулировали случайный выбор гена на цепочке 7000 раз. И в каждом испытании посчитали отклонение от ожидаемого. Оказалось, что в 2320 случаях из 7000 отклонение оказалось больше или равно наблюдаемого в Вашем геноме отклонения 36.5. 2320 - это 33.1% от 7000, примерно, 1/3.

Значит, в ПРЕДПОЛОЖЕНИИ, что гены в геномах СЛУЧАЙНО "выбирают" цепочку, вероятность обнаружить в геноме отклонение числа генов на одной цпочке от ожидаемого, такое же, как в Вашем геноме или больше, равна 1/3.

Вы увидели событие, вероятность которого 1/3 (если гипотеза верна). Опровергает ли Ваше наблюдение ГИПОТЕЗУ?

Вот если бы Вы увидели событие, вероятность которого равна, 1/1000, тогда стоило бы задуматься о том, верна ли гипотеза.

Скрипт. Команда i += 1 в цикле for i in range(5510) БЕССМЫСЛЕНА! (но не влияет на ответ)