Учебная страница курса биоинформатики,
год поступления 2020
Напишите мини-обзор данных, доступных в результате секвенирования генома данной вам бактерии или археи
Секвенирование - это определение последовательности оснований ДНК.
Геном - это совокупность всей ДНК организма. У многоклеточных эукариот, например, людей, геном содержится в каждой клетке организма; во всех клетках он одинаков.
Бактерия — это бактерия; архея — вроде бактерии, но эволюционные пути бактерий и архей разошлись в глубокой древности (1,5 – 3,5 млрд лет тому назад)
Доступные данные
Хромосомная таблица. Содержит список генов белков и генов РНК, закодированных в геноме и информацию о каждом гене: координаты гена в последовательности ДНК, тип гена, название продукта гена — белка или РНК.
(*) Банк Uniprot, содержащий дополнительную информацию о белках протеома. Использовать эту информацию в отчете не обязательно, но интересно.
В словарик
Ген белка — участок ДНК бактерии, кодирующий аминокислотную последовательность белка
Протеом — совокупность всех белков, закодированных в ДНК
Ген РНК — участок ДНК бактерии, с которого синтезируется молекула РНК, нужная организму, но не транслирующаяся в белок
Оформление мини-обзора
- Мини-обзор на русском языке в формате .pdf должен быть доступен по ссылке со страницы
'Зачётные задания по блоку 3' (см. Подсказки как поставить ссылку)
- Форматирование должно соответствовать требованиям журнала. Выбор журнала за вами.
- Результаты должны быть получены и представлены с помощью средств Excel, Google Sheet или аналогов. Использование собственных скриптов на python, других программ и веб-сервисов допускается, при указании ссылок на них.
- Должен быть раздел "Сопроводительные материалы", содержащий ссылку на ваш файл в формате Excel
Образцы
[ Bioinformatics ] [ JBCB ]
Разделы мини-обзора
Заголовок (Title) Придумайте сами. Например, "Обзор протеома бактерии ..."
Автор — это Вы.
Резюме (Abstract) Краткое описание работы. Должно быть написано так, чтобы было более или менее понятно, что, для чего и как вы делали, и что получилось. Объём резюме — не более 50 слов.
Ключевые слова 3–6 слов, не более. Служат для поиска литературы
Введение (Introduction) Задача данного раздела — ввести читателя в курс дела и объяснить, для чего была сделана работа. Объяснение типа "Нам задали написать обзор" — не то, что требуется.
В этом разделе стоит написать коротко, что известно про бактерию и/или про её геном, обязательно со ссылками на источники! В конце введения нужно написать одну-две фразы о том, что сделано в вашей работе.
Материалы и методы (Materials and methods) Укажите веб-адрес, откуда скачивались материалы.
В данном отчёте следует указать какие возможности ЭТ использовались в каком разделе обработки данных. Нужно для зачета соответствующих умений, если все в порядке. Если написали скрипты для обработки данных, то укажите какие и что делают.
Опишите не очевидные ваши действия. Например, как определяли рибосомальные белки, трансмембранные белки, какие строчки таблицы считали псевдогенами и др.
Всё очень коротко.
Результаты (Results) Понятное описание ваших результатов. Понятное — значит, состоит из грамматически корректных фраз русского языка. Нельзя написать "Геном — 4123500п.н., генов — 3021, РНК — 63" так как это не фраза, читатель ничего не поймет :(. Результаты нужно разделить на подразделы. Например, Гистограмма длин белков и др. Результаты лучше всего представлять в виде таблиц и рисунков. Однако в тексте отчета обязаны быть ссылки на каждую таблицу и каждый рисунок. Например, такие "Как видно на Рис.2, в геноме бактерии чаще всего встречаются белки из 700–800 аминокислотных остатков."
Обсуждение (Discussion) Обсуждение полученных результатов, того, как они вписываются в картину мира. Часто раздел содержит гипотезы и теории автора, которые они предлагают для объяснения результатов.
Вам, конечно, нужно обсудить, какие выводы вы можете сделать из таблиц и гистограмм. Напишите, белки какой длины встречаются чаще всего. Опишите особенности распределения белков по длинам, которые показались вам интересными/удивительными/странными. Ваши суждения об распределении генов по цепям ДНК. Все, что найдёте интересного!
Допустимый вариант — объединить разделы "Результаты" и "Обсуждение" в один: "Результаты и обсуждение". Так иногда поступают в статьях в научных журналах.
Заключение (Conclusion) Краткое заключение. Можете опустить, если что-то похожее есть в конце обсуждения.
Сопроводительные материалы (Supplementary materials) Ссылка на файл .xlsx, в котором приведены все расчеты. Оформление файла должно быть понятно читателям!
Благодарности (Acknowledgments) Обычно благодарят тех, кто помогал в работе, в подготовке публикации, или спонсировал исследования.
Конфликт интересов Можете опустить :)
Список литературы (References) Список ссылок на статьи, книги, сайты и др., которые были использованы (упоминались) в тексте.
Содержание мини-обзора
Какие навыки работы с ЭТ засчитываются на основе файла из Сопроводительных материалов
- Напишите в разделе Материалы и методы какие возможности использовали.
как минимум один рисунок (гистограмма — это тоже рисунок) и одну таблицу.
Вопросы, ответы на которые можно включить в мини-обзор
Вопросы студентов я переформулировал так, чтобы ответ можно было получить доступными вам методами.
Приношу извинения, если допустил ошибки в авторстве вопросов. С трудом разобрал свой почерк.( А ссылки на запись пока не нашел.) Напишите, если обнаружите ошибки.
Переформулировки вопросов студентов
- (Борис)Верно ли, что в геноме бактерии встречаются только четыре буквы: A, T, G, C?
- (Ума, Дарья Латорцева)Найдите и опишите повторяющиеся последовательности в геноме, появление которых нельзя объяснить случайностью. См. страницу Помощь. Уточнения (ААл). Последовательности должны быть длинными, т.к. совпадающие короткие последовательности встречаются в любом геноме по случайным причинам. Достаточно найти несколько примеров (хотя бы один).
- (Анастасия) Как определяется начало кольцевой ДНК в файле с последовательностью генома? Переформулировка (ААл): проверьте, правильно ли выбрано начало ДНК в файле с вашим геномом. См. описание проверки на стр. Помощь. Появится со временем.
- (Михаил Никонов, Артем Васильев) Является ли распределение генов белков по цепям ДНК (прямой + и обратной -) случайным? См. стр. Помощь.
- (ААл) Разделим геном на две части: первую половину и вторую половину. Случайно ли распределение генов по цепочкам ДНК для каждой половины?
- (София Наварнова) Есть ли протеом в котором есть все белки? Переформулировка (ААл): Приведите пример белка, без которого, по вашему мнению, не может жить бактерия, но в протеоме вашей бактерии его найти не удалось.
- (Артем Васильев) Определите размер вашего генома. Уточнение (ААл) Перечислите все ДНК, составляющие геном вашей бактерии и для каждой вычислите размер в числе пар нуклеотидов (это число равно числу букв в последовательности). Во многих случаях (но не во всех) геном будет состоять из одной хромосомы. В остальных случаях можно все вычисления проводить для одной, самой длинной, хромосомы.
- (Александр Невернов) Найдите открытые рамки считывания (open reading frame ORF) в вашем геноме. См. стр. Помощь. Переформулировка (ААл): Составьте список всех ORF в вашем геноме, отметьте те, координаты которых совпадают с координатами генов белков. Составьте таблицу для сравнения генов белков и ORF.
- (Артём Васильев) Какую часть генома занимают последовательности кодирующие белки (CDS) и какую последовательности все видов РНК, кроме матричных РНК.
- (Анна) Какие нуклеотиды стоят в третей позиции кодонов? (ААл) Образованные студенты пошли! Переформулирую позже. Кое-что надо объяснить всем студентам, чтобы они могли выполнить это задание.
- (Максим Смирнов) Выполнить анализ k-меров в геноме.
- (Екатерина Тычкова) вычислить частоты комплементарных пар A-T и G-C в геномной ДНК.
Из презентации, слайд Лингвистический анализ
- Вычислите частоты всех букв в геноме вашей бактерии.
- Верно ли, что число букв A примерно равно числу букв T, а число букв G приблизительно равно числу букв C в последовательности одной цепочки геномной ДНК? (Второе правило Чаргаффа)?
Варианты того, что можно исследовать дополнительно