Учебная страница курса биоинформатики,
год поступления 2010
Контрольная работа
Контрольная считается засчитанной, если по ней вы набрали более 1 балла. Баллы за задачи суммируются.
Задачи 1 – 4 не имеет смысла делать в другом порядке. Остальные задачи можно делать в любом порядке.
(0.5 балла) Скачайте с сайта PFAM последовательности доменов для семейств, приведённых ниже (адрес для скачивания последовательностей семейства PF00126 выглядит так: http://pfam.sanger.ac.uk/family/alignment/download/format?acc=PF00126&alnType=full&format=fasta&order=t&case=l&gaps=none&download=1)
- PF00115, PF00005, PF00078, PF00400, PF00516, PF07690, PF00072, PF00077, PF00528, PF02518, PF13465, PF13631, PF00069, PF00361, PF12796, PF00271, PF00032, PF00126, PF03466, PF06817
Если проблемы с сетью, то скачайте семейства PF00126, PF00046 PF00961 по адресу: http://kodomo.fbb.msu.ru/FBB/year_10/term5/unix/6/PF00126_full.txt
- (0.3 балла) Запустите каждое из семейств перевыравниваться и приступайте к следующему пункту, не дожидаясь, пока программа выравнивания доработает (в том терминале).
Подсказка: если muscle не хватает памяти, можно попробовать воспользоваться, например, mafft: mafft --retree 2 --maxiterate 0 a.fasta > b.fasta
- (0.5 балла) Пока семейства перевыравниваются, для каждого выравнивания выпишите в отдельный файл обозначения названий организмов в семействе. Названия организмов можно вытащить из названий последовательностей. (Забегая в следующую тему: команда sed -r 's@.*_([A-Z0-9]+)/.*@\1@', если ей на стандартный ввод подать только строки, содержащие заголовки последовательностей, оставит от заголовков только вторую часть uniprot ac, т.е. условное название организма)
- (0.5 балла) В каком семействе больше всего разных организмов? В каком семействе больше всего одинаковых?
- (0.5 балла) Сделайте секундомер, который показывает с интервалом в 1 секунду очередное число из диапазона от 1 до 100.
- (0.5 балла) Некоторые программы в то время, пока они делают какую-то часть, которая занимает большое, но непредсказуемое, время, рисуют в качестве часов вращающуюся палочку (т.е. поочередно сменяющую друг друга на экране последовательность символов | / - \ | / - \ ...). Сделайте такие же часы с помощью шелл-скрипта.
(Посдказка: вам понадобится ещё раз тщательно изучить, что умеет echo, и вам потребуется воспользоваться значком '\r', который некоторые программы трактуют следующим образом: перевести курсор в начало строки)