Секвенирование по Сэнгеру

Взяли хроматограммы прямой и обратной цепи какой-то последовательности и посмотрели на их качество. Для этого их открыли в программе 4Peaks. И выровняли относительно друг друга.
И в целом на первый взгляд они оказываются неплохими. В среднем уровень сигнала оказывается в четыре-пять раз выше шума. Впрочем высота пиков оказывается не одинаковой, раз в тридцать нуклеотидов появляются высокие пики. В центральной части пики достаточно узкие, не накладываются друг на друга. На прямой цепи в центральной части было обнаружено 40 гэпов, на обратной 60. Однако в основном позиции гэпов не пересекались и можно было вполне установить, какой это нуклеотид. Конечно, качество концов оставляет желать лучшего, но ничего иного ожидать никогда и не приходится.
Из бинарного файла можно было извлечь следующие сведения о качестве секвенирования:
3' и 5' концы было достаточно трудно разобрать, поэтому я их обрезал в обоих последовательностях. С 3' конца прямой 47 (встроенная утилита предлагала 18), с обратной 52 (программа предлагала 9), 5' конец прямой был отрезан с 689 позиции (программа предлагала 758), а у обратной с 694 (программа предлагала 770).

../../term1/block2/pr5/square.png
Рисунок 1. Фрагмент с 5' конца обратной цепи, который программа предлагала оставить.

Далее будут представлены примеры сделанных замен в прямой цепи на основе выравнивания с обратной и оценки качества пиков. Сверху прямая цепь, снизу обратная.

../../term1/block2/pr5/square.png
Рисунок 2. На прямой цепи присутствует неясность между пиками: то ли это C, то ли A. Однако на противоположной цепи, мы видим четко, что это C
../../term1/block2/pr5/square.png
Рисунок 3. На прямой цепи перекрываются пики C и G. Однако на обратной цепи мы видим, что здесь всё-таки C.
../../term1/block2/pr5/square.png
Рисунок 4. Здесь мы видим сразу два примера того, как слабые, но корректные пики C и T на фоне сильных воспринимаются, как шум. Обратная цепь позволяет однозначно их восстановить.
../../term1/block2/pr5/square.png
Рисунок 5. На обоих хроматограммах мы видим наложение G и A, поэтому следует воспользоваться таблицей кодов вырожденных нуклеотидов и поставить R.
../../term1/block2/pr5/square.png
Рисунок 6. Здесь еще один пример того, как два пика (G и C) накладываются друг на друга на прямой цепи. Но обратная позволят однозначно расшифровать нуклеотид (С).

Сами хроматограммы можно скачать здесь: прямая и обратная .
Отредактированная прямая последовательность
Выравнивание отредактированной прямой последовательности и изначальной обратной (перевернутой комплементарной к обратной).

Плохая хроматограмма

В качестве примера плохой хроматограммы был взят образец WS2943_SP6R.ab1.
Здесь видны множественные наслоения пиков друг на друга, кроме того они неадекватно большого размера. Это можно связать либо с техническим загрязнением самого секвенатора или же образца другой ДНК. По такой хроматограмме ничего установить нельзя.

../../term1/block2/pr5/square.png
Рисунок 7. Пример плохой хроматограммы.

Назад

©Бакулин Артемий, 2018