Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2014

Упражнения

Для проверки следует создать веб-страницу Excel и с нее поставить ссылки на файлы .xlsx (или .xls). В случае, если используете Google Sheet, то поставьте ссылку на него, сделав этот документ Public - открытым на чтение для всех.

Задание 1:

Определить число видов данного таксона, геном которых секвенирован и составить сводную таблицу статусов полноты секвенирования

Данные: eukaryotes.txt или prokaryotes.txt, выюор за студентом.

Откуда скачивать данные: ftp://ftp.ncbi.nlm.nih.gov/genomes/GENOME_REPORTS/

Этапы.

  1. Создайте .xls (или .xlsx) файл с плоской таблицей из файла eukaryotes.txt. Следите, чтобы даты были введены корректно!
  2. Отформатируйте таблицу чтобы была удобной для рассматривания
  3. Создайте страницу organisms
  4. Создайте сводную таблицу, в которой строки соответствуют названиям организмов, столбцы - статусам геномов (колонка status), в ячейке - число сборок генома с таким статусом
  5. Создайте страницу legend. Внесите ответы на вопросы:
    • У скольких видов эукариот секвенированы геномы
    • У скольких геном признан секвенированным полностью (complete или complete genome)
    • У какого вида самый большой геном среди секвенированных и какой его размер? Указать также группу и подгруппу.
    • У какого вида самый низкий GC состав и у какого - самый высокий? Указать проценты нукл. G и С.