Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2010

awk

  1. Почитайте man awk. Обратите внимание в нём на арифметические функции.
  2. (0.5 балла) В выдаче BLAST найдите имена находок (колонка 2), которые целиком лежат в заданном диапазоне координат по запросу. (Начало и конец находки в запросе – колонки 7 и 8). Пример выдачи: /FBB/year_10/term5/unix/eg.blast, интервал от 271700 до 272700. NB. В табличной выдаче BLAST для находок на комплементарной цепи координаты в запросе поменяны местами.

  3. (0.5 балла) Постройте гистограмму распределений середин находок в том же файле с шагом 100. (Подсказка: чтобы округлить число до ближайшей сотни, его нужно поделить на 100, округлить до единицы, и помножить обратно на 100).

  4. (1.5 балла) В выдаче BLAST для каждой последовательности запроса выпишите самую длинную находку. (Название запроса – колонка 1, координаты начала и конца находки – колонки 5 и 6).