Учебная страница курса биоинформатики,
год поступления 2013
Отчёт о "своих" прокариоте, белке, вирусе
Этот отчёт нужен для того, чтобы мы могли проверить информацию, которую Вы должны будете поместить на своем сайте. Сайт будет открыт для всего мира, и по нему смогут судить о Вас и о нашем факультете.
Обратите внимание: если используется информация откуда-то, кроме самой выданной записи или картинок из геномного браузера на сайте NCBI, то должна стоять ссылка на источник этой информации. Как оформлять ссылки - см. тут, раздел 7.
"Текстовое описание" – это один или несколько абзацев связного текста, содержащего в том числе требуемую информацию. Чтобы понять, является ли Ваш текст связным, представьте себе, что этот текст появляется в начале параграфа "Вирус XXX", "Бактерия YYY" или "Белок ZZZ" учебника: то есть его должен прочитать человек, не имеющий никакого представления о содержимом страницы с этим заданием и не знающий ничего конкретного о вашем вирусе, прокариоте или белке.
Пункты, помеченные (*), не были в заданиях блока 1 и потому не являются обязательными. Однако они являются желательными для вашего сайта. Дополнительную информацию можно получить в геномном браузере на NCBI или с помощью google. В примере отчёта такая дополнительная (т.е. необязательная) информация залита зеленым.
Раздел 1. Вирус
Текстовое описание вируса должно содержать:
- английское название вируса;
(*) к какому классу относится вирус по типу носителя генома (указан в поле OC после слова Virus в записи EMBL; в поле Taxonomy в записи RefSeq или GenBank);
- (*) информацию о хозяине вируса и/или его особенностях;
- идентификатор выданной вам записи с геномом вируса в базе данных EMBL;
- описание того, последовательность чего приведена в записи: полного генома вируса, фрагмента генома или еще какая-то;
- длину последовательности в записи (с указанием единицы измерения - нуклеотиды или пары нуклеотидов);
- число генов в выданной записи, ссылку на табл.1;
Таблицу 1 с описанием генов вируса (таблица 1 из pr3);
- ссылки на рис. 1 и 2 и описание особенностей расположения генов, изображенных на этих рисунках (случаев перекрытия генов, наличие сдвига рамки считывания при трансляции (translational frameshift) и др.).
Рисунок 1, показывающий расположение генов в геноме (или его фрагменте) (рисунок 1 из pr4)
Рисунок 2, показывающий какую-либо особенность генов; если таковых не обнаружено, то 5' конец гена c инициаторным кодоном или 3'-конец со стоп-кодоном (рисунок 2 из pr4)
Раздел 2. Прокариотический организм
Текстовое описание прокариотического организма должно содержать:
- полное латинское название (род, вид, штамм);
- принадлежность к домену (бактерия или архея);
- (*) информацию о самой бактерии/археи: где живет, чем интересна и др.
идентификатор(ы) записи(ей) в базе данных RefSeq на сайте NCBI, которые содержат информацию о полном геноме этого организма;
длину последовательности полного генома (если записей несколько – то отдельно для каждой и сумму, в парах нуклеотидов);
- общее число генов в полном геноме;
- число генов, кодирующих белки;
- описание оперона АТФ-синтазы, включающее:
- объяснение, что такое АТФ-синтаза;
описание вероятного оперона АТФ-синтазы в геноме, а именно, ссылку на рисунок 3, изображающий гены, соседние с данным вам геном одной из компонент АТФ-синтазы (рисунок 4 из пр.4); ссылку на таблицу 2 с генами, соседними с данным геном; ваш вывод о вероятном составе оперона
- тип АТФ-синтазы (V или F);
Рисунок 3 - рисунок с опероном АТФ-синтазы из задания 4 pr4.
Таблица 2 - таблица 2 с описанием генов вероятного оперона из pr4.
Раздел 3. Белок
Текстовое описание белка должно содержать:
русское название белка (перевод поля /product), в скобках - английское название. Ссылка на таблицу 3, в которой приведена минимальная информация о белке и его гене;
- предположение о том, входит ли этот ген в какой-то оперон; в качестве подтверждения своей гипотезы - отсылка к рис. 4 и указание расстояния между Вашим геном и его ближайшими соседями;
Рисунок 4 - рисунок с окружением вашего гена из задания 3 pr4.
Таблица 3 - измененная таблица 3 из pr3 (см. ниже)
Таблица 3. Информация о белке <русское название белка в родительном падеже> из организма <латинское название организма> (идентификатор белка в базе данных RefSeq NP_XXXXXX)
Вид информации |
Квалификатор в записи генома |
Значение |
Локус гена в геноме |
/locus_tag |
... |
Имя гена |
/gene |
... |
Идентификатор гена в базе Gene |
/db_xref="GeneID ... |
... |
Начало гена в геноме |
— |
... |
Конец гена в геноме |
— |
... |
На какой цепи кодируется ген (прямая или обратная) |
— |
... |
Длина гена (в парах нуклеотидов) |
— |
... |
Идентификатор белка в базе данных NCBI Protein |
/protein_id |
... |
Длина белка (в аминокислотных остатках) |
— |
... |