Учебная страница курса биоинформатики,
год поступления 2014
Для проверки следует создать веб-страницу Excel и с нее поставить ссылки на файлы .xlsx (или .xls). В случае, если используете Google Sheet, то поставьте ссылку на него, сделав этот документ Public - открытым на чтение для всех.
Задание 1:
Определить число видов данного таксона, геном которых секвенирован и составить сводную таблицу статусов полноты секвенирования
Данные: eukaryotes.txt или prokaryotes.txt, выюор за студентом.
Откуда скачивать данные: ftp://ftp.ncbi.nlm.nih.gov/genomes/GENOME_REPORTS/
Этапы.
- Создайте .xls (или .xlsx) файл с плоской таблицей из файла eukaryotes.txt. Следите, чтобы даты были введены корректно!
- Отформатируйте таблицу чтобы была удобной для рассматривания
- Создайте страницу organisms
- Создайте сводную таблицу, в которой строки соответствуют названиям организмов, столбцы - статусам геномов (колонка status), в ячейке - число сборок генома с таким статусом
- Создайте страницу legend. Внесите ответы на вопросы:
- У скольких видов эукариот секвенированы геномы
- У скольких геном признан секвенированным полностью (complete или complete genome)
- У какого вида самый большой геном среди секвенированных и какой его размер? Указать также группу и подгруппу.
- У какого вида самый низкий GC состав и у какого - самый высокий? Указать проценты нукл. G и С.