Учебная страница курса биоинформатики,
год поступления 2015
Excel-1
Создайте веб-страницу Excel на своем сайте.
Задание 1. Выполнить не менее чем по одному упражнению из каждого блока
Таким образом, для зачёта минимальное число выполненных упражнений — шесть.
- На веб-странице поставьте ссылку на Excel файл с выполненными упражнениями
- Одно упражнение — на одном листе файла
- Название листа должно быть говорящим, но коротким. Не используйте русские буквы и пробелы!
- Упражнение можно сдать на занятии. Это не исключает необходимости поставить ссылку на файл на веб-странице.
Задание 2: составьте таблицу, в которой для каждой плазмиды указан род и вид организма-хозяина
- В отчет включите:
- ссылку на файл .xlsx (или Google Sheet, сделав этот документ Public — открытым на чтение для всех), в котором:
- лист "plasmids" содержит необходимую информацию;
- лист "genera" (множественное от genus) содержит таблицу со списком родов и числом плазмид в каждом роде;
- лист "info" содержит данные для ответов на вопросы:
- сколько плазмид известно в роде, к которому принадлежит ваша бактерия или архея?
- сколько – в том же виде?
- длина самой короткой плазмиды;
- длина самой длинной плазмиды;
- средняя длина плазмид;
- медиана длин плазмид.
- опишите (на веб-странице), что нового вы узнали о плазмидах (в т.ч. ответы на вопросы, сформулированные выше)?
- как извлекали род из названия организма?
- как составляли сводную таблицу по родам?
- ссылку на файл .xlsx (или Google Sheet, сделав этот документ Public — открытым на чтение для всех), в котором:
- Этапы.
Информацию о плазмидах следует скачать с сайта anonymous@ftp.ncbi.nlm.nih.gov:/genomes/GENOME_REPORTS/plasmids.txt по протоколу ftp; рекомендуется использовать FAR => Netbox
- При импорте в Excel следите, чтобы числа с десятичной точкой не превратились в даты!!!
- Итоговая таблица plasmids должна содержать следующие колонки:
- идентификатор – придумайте сами какой;
- название плазмиды;
- идентификатор записи с последовательностью в БД Refseq;
то же — в INSDC;
род организма-хозяина — первое слово в названии организма, если:
это слово начинается с заглавной буквы (если первый символ – кавычка, скобка или строчная буква, считаем, что ни род, ни вид для организма не определён, ставим прочерк "–");
это не слово "Candidatus" (если первое слово – "Candidatus", то родовым названием является второе слово, но "на тройку" в этом случае тоже можно поставить прочерк) .
- (*) колонка с названием вида — второе слово в названии организма (третье у Candidatus'ов); это задание является ДОПОЛНИТЕЛЬНЫМ.
- название организма и все остальные колонки из скачанного файла.
- Создайте сводную таблицу genera.
- Оформите веб-страницу практикума.
- Заявите о готовности в очереди на проверку.
В процессе...