Учебная страница курса биоинформатики,
год поступления 2014
Задание
1.1 (1 балл) Запишите в файл данные по размеру генома и числу генов для всех организмов со страницы http://tools.neb.com/~vincze/genomes/. Формат выходного файла:
#организм размер_генома число_генов
разделители - табуляция.
Адрес страницы должен являться первым позиционным параметром, задаваемым из командной строки.
1.2 (+1 балл к заданию 1.1) В предыдущем задании добавьте в выходной файл описание для 10 случайных организмов (описание находится на html странице, на которую вы перенаправляетесь по щелчку на имя организма). Формат выходного файла:
#организм размер_генома число_генов описание_организма
разделители - табуляция.
Адрес страницы должен являться первым позиционным параметром, задаваемым из командной строки, со значением по умолчанию равным указанному в задании; число организмов должно быть именованным параметром, со значением по умолчанию = 10.
2.1 (1 балл) Зайдите в репозиторий данных по экспрессии - http://www.genboree.org/EdaccData/Current-Release/study-sample-experiment/UW/Fetal_Lung/Expression_Array/. Составьте и выведите на экран список url’в для скачивания всех файлов формата TXT с этой страницы. Скачайте любой один из этих файлов.
Адрес страницы должен являться первым позиционным параметром, задаваемым из командной строки.
2.2 (+1 балл к заданию 2.1) Сделайте так, чтобы отрисовывался прогресс–бар для процесса скачивания.
Адрес страницы должен являться позиционным параметром, задаваемым из командной строки, со значением по умолчанию равным указанному в задании; формат (расширение) файлов, для которых необходимо составить список, должен быть именованным параметром, со значением по умолчанию = 'txt'.