Какие брать концентрации нуклеотидов?

Определение качества определения позиций

Для начала мы загрузим подгрузим пакеты. По умолчанию их нет, но их можно установить при помощи команды:

pip3 install biopython seaborn matplotlib

Далее мы посмотрим список файлов (чтобы не прописывать их руками) и подгрузим их все с список records.

На примере одной последовательности нарисуем распределение качества прочтения.

Посмотрим на то, что творится с качеством у какой-нибудь другой последовательности.

У неё тут всё гораздо ровнее в центре. Давайте попытаемся как-то визуализировать распределение качества в двух координатных осях: (а) в зависимости от того, какой нуклеотид у нас по порядку и (б) в зависимости от того, в какой части хроматограммы он оказался в процентах (т. е. отнормируем длины).

Сделаем дополнительный контроль — разобьём на диапозоны длина последовательности // 200.

Вместо качества используем вероятность ошибки