Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2013

Отчёт о "своих" прокариоте, белке, вирусе

Этот отчёт нужен для того, чтобы мы могли проверить информацию, которую Вы должны будете поместить на своем сайте. Сайт будет открыт для всего мира, и по нему смогут судить о Вас и о нашем факультете.

Обратите внимание: если используется информация откуда-то, кроме самой выданной записи или картинок из геномного браузера на сайте NCBI, то должна стоять ссылка на источник этой информации. Как оформлять ссылки - см. тут, раздел 7.

"Текстовое описание" – это один или несколько абзацев связного текста, содержащего в том числе требуемую информацию. Чтобы понять, является ли Ваш текст связным, представьте себе, что этот текст появляется в начале параграфа "Вирус XXX", "Бактерия YYY" или "Белок ZZZ" учебника: то есть его должен прочитать человек, не имеющий никакого представления о содержимом страницы с этим заданием и не знающий ничего конкретного о вашем вирусе, прокариоте или белке.

Пример отчёта

Пункты, помеченные (*), не были в заданиях блока 1 и потому не являются обязательными. Однако они являются желательными для вашего сайта. Дополнительную информацию можно получить в геномном браузере на NCBI или с помощью google. В примере отчёта такая дополнительная (т.е. необязательная) информация залита зеленым.

Раздел 1. Вирус

  1. Текстовое описание вируса должно содержать:

    • английское название вируса;
    • (*) к какому классу относится вирус по типу носителя генома (указан в поле OC после слова Virus в записи EMBL; в поле Taxonomy в записи RefSeq или GenBank);

    • (*) информацию о хозяине вируса и/или его особенностях;
    • идентификатор выданной вам записи с геномом вируса в базе данных EMBL;
    • описание того, последовательность чего приведена в записи: полного генома вируса, фрагмента генома или еще какая-то;
    • длину последовательности в записи (с указанием единицы измерения - нуклеотиды или пары нуклеотидов);
    • число генов в выданной записи, ссылку на табл.1;
    • Таблицу 1 с описанием генов вируса (таблица 1 из pr3);

    • ссылки на рис. 1 и 2 и описание особенностей расположения генов, изображенных на этих рисунках (случаев перекрытия генов, наличие сдвига рамки считывания при трансляции (translational frameshift) и др.).
  2. Рисунок 1, показывающий расположение генов в геноме (или его фрагменте) (рисунок 1 из pr4)

  3. Рисунок 2, показывающий какую-либо особенность генов; если таковых не обнаружено, то 5' конец гена c инициаторным кодоном или 3'-конец со стоп-кодоном (рисунок 2 из pr4)

Раздел 2. Прокариотический организм

  1. Текстовое описание прокариотического организма должно содержать:

    • полное латинское название (род, вид, штамм);
    • принадлежность к домену (бактерия или архея);
    • (*) информацию о самой бактерии/археи: где живет, чем интересна и др.
    • идентификатор(ы) записи(ей) в базе данных RefSeq на сайте NCBI, которые содержат информацию о полном геноме этого организма;

    • длину последовательности полного генома (если записей несколько – то отдельно для каждой и сумму, в парах нуклеотидов);

    • общее число генов в полном геноме;
    • число генов, кодирующих белки;
    • описание оперона АТФ-синтазы, включающее:
      • объяснение, что такое АТФ-синтаза;
      • описание вероятного оперона АТФ-синтазы в геноме, а именно, ссылку на рисунок 3, изображающий гены, соседние с данным вам геном одной из компонент АТФ-синтазы (рисунок 4 из пр.4); ссылку на таблицу 2 с генами, соседними с данным геном; ваш вывод о вероятном составе оперона

      • тип АТФ-синтазы (V или F);
  2. Рисунок 3 - рисунок с опероном АТФ-синтазы из задания 4 pr4.

  3. Таблица 2 - таблица 2 с описанием генов вероятного оперона из pr4.

Раздел 3. Белок

  1. Текстовое описание белка должно содержать:

    • русское название белка (перевод поля /product), в скобках - английское название. Ссылка на таблицу 3, в которой приведена минимальная информация о белке и его гене;

    • предположение о том, входит ли этот ген в какой-то оперон; в качестве подтверждения своей гипотезы - отсылка к рис. 4 и указание расстояния между Вашим геном и его ближайшими соседями;
  2. Рисунок 4 - рисунок с окружением вашего гена из задания 3 pr4.

  3. Таблица 3 - измененная таблица 3 из pr3 (см. ниже)



Таблица 3. Информация о белке <русское название белка в родительном падеже> из организма <латинское название организма> (идентификатор белка в базе данных RefSeq NP_XXXXXX)

Вид информации

Квалификатор в записи генома

Значение

Локус гена в геноме

/locus_tag

...

Имя гена

/gene

...

Идентификатор гена в базе Gene

/db_xref="GeneID ...

...

Начало гена в геноме

 —

...

Конец гена в геноме

 —

...

На какой цепи кодируется ген (прямая или обратная)

 —

...

Длина гена (в парах нуклеотидов)

 —

...

Идентификатор белка в базе данных NCBI Protein

/protein_id

...

Длина белка (в аминокислотных остатках)

 —

...