Учебная страница курса биоинформатики,
год поступления 2010
awk
- Почитайте man awk. Обратите внимание в нём на арифметические функции.
(0.5 балла) В выдаче BLAST найдите имена находок (колонка 2), которые целиком лежат в заданном диапазоне координат по запросу. (Начало и конец находки в запросе – колонки 7 и 8). Пример выдачи: /FBB/year_10/term5/unix/eg.blast, интервал от 271700 до 272700. NB. В табличной выдаче BLAST для находок на комплементарной цепи координаты в запросе поменяны местами.
(0.5 балла) Постройте гистограмму распределений середин находок в том же файле с шагом 100. (Подсказка: чтобы округлить число до ближайшей сотни, его нужно поделить на 100, округлить до единицы, и помножить обратно на 100).
(1.5 балла) В выдаче BLAST для каждой последовательности запроса выпишите самую длинную находку. (Название запроса – колонка 1, координаты начала и конца находки – колонки 5 и 6).