Учебная страница курса биоинформатики,
год поступления 2019
Напишите (мини-) обзор данных, доступных в результате секвенирования генома данной вам бактерии или археи
Секвенирование - это определение последовательности оснований ДНК.
Геном - это совокупность всей ДНК организма. У многоклеточных эукариот, например, людей, геном содержится в каждой клетке организма; во всех клетках он одинаков.
Бактерия — это бактерия; архея — вроде бактерии, но эволюционные пути бактерий и архей разошлись в глубокой древности (1,5 – 3,5 млрд лет тому назад)
Доступные данные
Хромосомная таблица. Содержит список генов белков и генов РНК, закодированных в геноме и информацию о каждом гене: координаты гена в последовательности ДНК, тип гена, название продукта гена — белка или РНК.
(*) Банк Uniprot, содержащий дополнительную информацию о белках протеома. Использовать эту информацию в отчете не обязательно, но интересно.
В словарик
Ген белка — участок ДНК бактерии, кодирующий аминокислотную последовательность белка
Протеом — совокупность всех белков, закодированных в ДНК
Ген РНК — участок ДНК бактерии, с которого синтезируется молекула РНК, нужная организму, но не транслирующаяся в белок
Оформление мини-обзора
- Мини-обзор на русском языке в формате .pdf должен быть доступен по ссылке со страницы
'Зачётные задания по блоку 3' (см. Подсказки как поставить ссылку)
- Форматирование должно соответствовать требованиям журнала. Выбор журнала за вами.
- Результаты должны быть получены и представлены с помощью средств Excel (или аналогов). Использование собственных скриптов на python, других программ и веб-сервисов допускается, при указании ссылок на них.
- Должен быть раздел "Сопроводительные материалы", содержащий ссылку на ваш файл в формате Excel
Образцы
[ Bioinformatics ] [ JBCB ]
Разделы мини-обзора
Заголовок (Title) Придумайте сами. Например, "Обзор протеома бактерии ..."
Автор — это Вы.
Резюме (Abstract) Краткое описание работы. Должно быть написано так, чтобы было более или менее понятно, что, для чего и как вы делали, и что получилось. Объём резюме — не более 50 слов.
Ключевые слова 3–6 слов, не более. Служат для поиска литературы
Введение (Introduction) Задача данного раздела — ввести читателя в курс дела и объяснить, для чего была сделана работа. Объяснение типа "Нам задали написать обзор" — не то, что требуется.
В этом разделе стоит написать коротко, что известно про бактерию и/или про её геном, обязательно со ссылками на источники! В конце введения нужно написать одну-две фразы о том, что сделано в вашей работе.
Материалы и методы (Materials and methods) Укажите веб-адрес, откуда скачивались материалы.
В данном отчёте следует указать какие возможности ЭТ использовались в каком разделе обработки данных. Нужно для зачета соответствующих умений, если все в порядке. Если написали скрипты для обработки данных, то укажите какие и что делают.
Опишите не очевидные ваши действия. Например, как определяли рибосомальные белки, трансмембранные белки, какие строчки таблицы считали псевдогенами и др.
Всё очень коротко.
Результаты (Results) Понятное описание ваших результатов. Понятное — значит, состоит из грамматически корректных фраз русского языка. Нельзя написать "Геном — 4123500п.н., генов — 3021, РНК — 63" так как это не фраза, читатель ничего не поймет :(. Результаты нужно разделить на подразделы. Например, Гистограмма длин белков и др. Результаты лучше всего представлять в виде таблиц и рисунков. Однако в тексте отчета обязаны быть ссылки на каждую таблицу и каждый рисунок. Например, такие "Как видно на Рис.2, в геноме бактерии чаще всего встречаются белки из 700–800 аминокислотных остатков."
Обсуждение (Discussion) Обсуждение полученных результатов, того, как они вписываются в картину мира. Часто раздел содержит гипотезы и теории автора, которые они предлагают для объяснения результатов.
Вам, конечно, нужно обсудить, какие выводы вы можете сделать из таблиц и гистограмм. Напишите, белки какой длины встречаются чаще всего. Опишите особенности распределения белков по длинам, которые показались вам интересными/удивительными/странными. Ваши суждения об распределении генов по цепям ДНК. Все, что найдёте интересного!
Допустимый вариант — объединить разделы "Результаты" и "Обсуждение" в один: "Результаты и обсуждение". Так иногда поступают в статьях в научных журналах.
Заключение (Conclusion) Краткое заключение. Можете опустить, если что-то похожее есть в конце обсуждения.
Сопроводительные материалы (Supplementary materials) Ссылка на файл .xlsx, в котором приведены все расчеты. Оформление файла должно быть понятно читателям!
Благодарности (Acknowledgments) Обычно благодарят тех, кто помогал в работе, в подготовке публикации, или спонсировал исследования.
Конфликт интересов Можете опустить :)
Список литературы (References) Список ссылок на статьи, книги, сайты и др., которые были использованы (упоминались) в тексте.
Содержание мини-обзора
Какие навыки работы с ЭТ засчитываются на основе файла из Сопроводительных материалов
- Напишите в разделе Материалы и методы какие возможности использовали.
как минимум один рисунок (гистограмма — это тоже рисунок) и одну таблицу.
Minimum minimorum результатов для зачёта обзора
- Гистограмма длин белков из протеома своей бактерии или археи.
- Таблица числа генов белков, псевдогенов и генов РНК на прямой и комплементарной цепочках ДНК.
- Число гипотетических (hypothetical или ... сами попробуйте выбрать) белков в геноме и процент ото всех белков.
- Число рибосомальных (ribosomal) белков и рибосомальных РНК, закодированных в геноме. Их названия.
Варианты того, что можно исследовать дополнительно
- Проверьте гипотезу о том, что гены белков распределены по цепочкам случайно с вероятностями 1/2.
- Изучите "квазиопероны" в геноме вашей бактерии или археи. Статистика числа генов в квазиоперонах.
- Почему бы не сравнить числа генов белков в шести рамках считывания? Вдруг что-нибудь неожиданное обнаружится.
- Гистограмма длин межгенных промежутков.
- Статистика белков по категориям достоверности их существования.
- Вот какие категории можно постараться выделить и вычислить число белков в какой-нибудь категории.
- ATP synthases —- белки, составляющие большую машину с тем же названием, которая умеет синтезировать молекулы АТФ, служащих для запасании энергии
- ATPases — белки, использующие энергию АТФ путем расщепления молекулы АТФ (АТФ = ATP)
- trasporters — транспортеры, белки, участвующие в обмене чрез мембрану.
- transmebrane proteins — белки, пронизывающие мембрану бактерии, включают транспортеры, каналы и рецепторы, передающие сигналы из внешней среды в цитоплазму
- regulator — скорее всего, такой термин встречается у белков – регуляторов транскрипции
- А кстати, хорошо бы найти РНК полимеразы, белки, участвующие в репликации генома, молекулярные моторы ....
- Придумайте лучше сами. Я устал и мне хочется спать. (Вам знакомо это состояние? ААл)
- Собственные вопросы автора и ответы на них идут с двойным баллом.