Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2015

Упражнения

Данные для упражнений лежат здесь. Поддиректории названны номером упражнения. Можно брать любой из файлов, если их несколько.

1. Вычислительные формулы

  1. (простое) Вычислите сумму первых 100 чисел Фибоначчи: F0 = 0, F1 = 1, Fn = Fn–1 + Fn–2 при n > 1.

  2. (посложнее) Постройте график функции Acos(2πnx + φ)

на отрезке [0;10] с интервалом 0,01. Объясните как меняется график при изменении параметров A, n, φ; здесь n — целое, A и φ — любые действительные.

2. Работа с текстами

  1. (простое) Дан файл с идентификаторами участков последовательностей белков (доменов — для тех, кто знает это слово). Создайте таблицу с четырьмя колонками: идентификатор всего белка (имеет вид XXXX_YYYYY), начало участка, конец участка, длина участка.

  2. (посложнее) Дан файл с последовательностью ДНК. Создайте таблицу с одной колонкой — последовательностью, записанной сверху вниз.

3. Ссылки

  1. Дан файл с последовательностью ДНК, записанной в один столбец. Составьте таблицу встречаемости нуклеотидов A, T, G, C в ней. Первая колонка – нуклеотид, вторая – число встреч, третья – процент от общего числа нуклеотидов.

  2. Дан файл с последовательностью белка, записанной в один столбец (возьмите свой белок). Составьте таблицу встречаемости 20-и аминокислотных остатков – аналогично предыдущему заданию.

4. Статистические

  1. (простое) Дан файл с набором длин последовательностей всех изоформ белков человека (с одного гена может экспрессироваться, т.е. производится, несколько изоформ белка в результате альтернативного сплайсинга). Рассчитайте среднюю длину, стандартное отклонение – характеристику разброса данных, медиану, минимальное и максимальное значение.

5. Логические

  1. Даны координаты генов в геноме в формате: первая колонка – первый нуклеотид старт-кодона, вторая колонка – последний нуклеотид стоп-кодона. Добавьте колонку "ориентация гена": 1, если он закодирован на прямой цепи, –1, если на обратной.

6. ВПР — вертикальный просмотр

  1. Дана последовательность белка в трехбуквенном коде. Создайте последовательность в однобуквенном коде, пользуясь таблицей перекодировки.