Вкусности стандартной библиотеки
План
- urllib:
- Простой пример
- urlencode
- GET vs POST
- firebug
- robots.txt
- robotparser
- утки!
- pickle
- StringIO
- copy
Задание
Памятка: задание – то, что обязательно выполнить для получения зачёта; упражнения – необязательные, но как правило задание решить проще, если сначала выполнить все упражнения; если вы меня пнёте, выдам вам комментарии про то, что и как лучше, и по заданию, и по упражнениям.
Упражнения
- ..
Напишите скрипт get-pfam.py для скачивания выравниваний из PFAM. Скрипт получает accession number выравнивания через параметр -a / --acc, имя выходного файла через параметр -o / --out (при этом если имя файла не задано, в качестве него он использует accession number с добавленным расширением .fasta).
Контрольная работа
Дано: в файле sequences.txt лежит 100500 (т.е. порядка 105) имён последовательностей; в файле sequences.fasta лежит 9000500 (т.е. порядка 107) последовательностей в формате FASTA. Задача: напишите программу, которая создаёт файл out.fasta, в котором лежат те последовательности из sequences.fasta, которые указаны в sequences.txt. Именем последовательности считается её часть от > в начале строки до первого же пробела. При этом программа должна работать за приемлемое время.