Учебная страница курса биоинформатики,
год поступления 2014
(*) - дополнительное задание
Задание: Написать мини-обзор протеома вашей бактерии/археи
Формат
- Мини-обзор на русском языке в формате .pdf должен быть доступен по ссылке с веб-страницы "Excel".
- Форматирование должно соответствовать требованиям журнала. Выбор журнала - за вами.
- Мини-обзор должен включать, как минимум, один рисунок (гистограмма - рисунок) и одну таблицу.
- Должен быть раздел или подраздел "Сопроводительные материалы", содержащий ссылку на ваш Excel файл
Результы для включения в мини-обзор
Все результаты должны быть получены с помощью Excel
- Гистограмма длин белков из протеома своей бактерии/археи
- Таблица числа генов белков и генов РНК на прямой и комплементарной цепочках ДНК
- (*) Данные об особенностях генов. Например, можно написать вот о чем:
- Проверьте гипотезу о том, что гены распределены по цепочкам случайно с вероятностью 0.5
- Посчитайте, сколько "квазиоперонов" в геноме вашей бактерии/археи
- Составьте статистические данные о пересечениях генов (если таковые обнаружатся)
- Опишите, а еще лучше - объясните случаи, когда длина кодирующей последовательности не делится на три (если таковые обнаружатся)
Пояснения
Считайте, что каждый ген входит в какой-нибудь "квазиоперон" (то есть квазиоперон может состоять из одного гена). Соседние гены входят в один "квазиоперон", если они расположены на одной цепи и расстояние между ними меньше 100 п.н. Посмотрите, как изменится число "квазиоперонов", если поменять порог на расстояние (например взять порог 50 п.н., или 200 п.н.).
Этапы выполнения
Скачайте описание протеома вашей бактерии/археи с сервера NCBI (ftp://ftp.ncbi.nlm.nih.gov/genomes/Bacteria/). Нужные вам файлы имееют расширение .ptt и .rnt, и лежат в папке с названием вашей бактерии/археи. Если в геноме больше одной ДНК (есть плазмиды, или несколько хромосом), выберите самую длинную, для которой есть файл .rnt, или (лучше, поставим больше баллов) используйте все файлы вместе и создайте одну таблицу, добавив две колонки: ДНК - номер хромосомы или название плазмиды (Chr1, pHPSAT464 и т.д.); Тип гена - CDS (ген, кодирующий белок) или RNA (ген, кодирующий РНК).
- Откройте файл в Excel, придумайте, какой должен быть разделитель, чтобы в вашем файле были все необходимые колонки (обратите внимание на возможность объединять разделители). Удалите лишние строки в начале файла, отредактируйте названия столбцов и сохраните его в формате .xls (или .xlsx).
- Создайте отдельный лист с гистограммой длин всех белков. Напишите, белки какой длины встречаются чаще всего. Опишите особенности распределения белков по длинам, которые показались вам интересными/удивительными/странными.
Содержание отчета
Заголовок (Title) Придумайте сами. Например, "Обзор протеома бактерии ..."
Резюме (Abstract) Краткое описание работы. Должно быть написано так, чтобы было более менее понятно, что, для чего и как вы делали, и что получилось.
Введение (Introduction) Задача данного раздела - ввести читателя в курс дела и объяснить, для чего была сделана работа.
Материалы и методы (Materials and methods) Описание использованных инструментов, источников исходных данных и другая информация, необходимая для воспроизведения результатов. В вашем случае надо упомянуть Excel (лучше с номером версии), можете написать, какими функциями вы пользовались и для чего. Ну и конечно написать, откуда скачивали исходные файлы.
Результаты (Results) Подробное описание результатов, ссылки на таблицы и картинки. Может включать подразделы. Например, у вас, скорее всего, будет подраздел про распределение длин белков и подраздел про распределение генов по цепям.
Обсуждение (Discussion) Обсуждение полученных результатов, того, как они вписываются в известную картину мира. Часто раздел содержит гипотезы и теории авторов, которые они предлагают для объяснения результатов.
Заключение (Conclusion) Краткое заключение. Можете опустить, если что-то похожее есть в конце обсуждения.
Сопроводительные материалы (Supplementary materials) Ссылка на файл .xls(x), в котором приведены все расчеты. Оформление файла должно быть понятно читателям!
Благодарности (Acknowledgments) Обычно благодарят тех, кто помогал в работе, при подготовке публикации, или спонсировал исследования.
Список литературы (References) Список ссылок на статьи, книги, и т.д., которые были использованы (упоминались) в тексте.