Чтение последовательностей по Сэнгеру

В этом практикуме мы учились работать с хромаграммами, который выдает нам каппилярный секвенатор. Необходимо было выявить проблеммы при чтении хроматограммы и получить последовательность ДНК.
Работа велась с файлами: прямая последовательность и обратная.

Задание 1. Получить последовательность ДНК и исправить проблемные места.

Общий вид хроматограмм

Ниже представлены участки хроматограмм, общий вид для ознакомления. Работа с хроматограммами велась с программе Chromas (Lite).

рис 1. Общий вид произвольного участка хроматограммы прямой последовательности.
Шум присутствует, довольно сильный, сильнее, чем на хроматограмме обратной последовательности. В целом, сигнал хороший, не всегда равномерный, пики четкие, не размытые, наложений пиков в большинстве своем нет. Шум составляет на глаз примерно 1/4 выосты пика.

рис 2. Общий вид произвольного участка хроматограммы обратной последовательности.
Здесь шум еще ниже, чем на хроматограмме прямой последовательности. Сигнал более равномерный, квадратики сверху заполнены лучше, чем на рисунке 1. Эти квадратики показывают достоверность сигнала. Шум составляет примерно 1/20 высоты пика.
Границы нечитаемых 5'- и 3'-участков в каждой последовательности
Границы нечитаемых 5'- и 3'-участков 5'-участок 3'-участок
Прямая последовательность 1-28 379-381
Обратная последовательность 1-4 324-381

Спорные моменты

Поскольку любые измерения точны не всегда до конца, некоторые нуклеотиды при прохождении детектора могли не распознаться или проба могла быть загрязнена. Поэтому встречаются разнообразные сложности. Рассмотрим некоторые интересные случаи ниже. Верхняя часть картинки относится к прямой последовательности, нижняя к обратной.

рис 3. Проблемный нуклеотид в прямой последовательности.
На позициях 134 и 135 в прямой последовательности слишком высокий шум не дал распознать нуклеотиды. В обратной последовательности можно заметить два цитозина в соответствующем месте и сигнал сильный. Заменяем обе N на c.

рис 4. Проблемный нуклеотид в прямой последовательности.
Ситуация положна на предыдущую. На позиции 163 прямой последовательности шум выше среднего. Если смотреть на обратную последовательность, в данном месте должны стоять цитозины. Заменяем N на c.

рис 5. Проблемный нуклеотид в обратной последовательности.
А теперь обратим внимание на обратную последовательность. Позиция 182 (по обратной последовательности). Снова шум был достаточно сильным. Но, если посмотреть на прямую последовательность, можно заметить сильный сигнал от тимина. Заменяем N на t.

рис 6. Сложный момент в обратной последовательности.
Ситуация выглядит совершенно запутанной. Позиции 274 и 275 заняты двуми N. Непонятно, куда относится высокий пик. Здесь точно есть два проблемных нуклеотида и странный пик нескольких цветов, быть может полиморфизм. Ситуацию спасает прямая последовательность, на которой все довольно однозначно - два цитозина. Заменим N на c, разноцветный пик скорее всего просто ошибка детектора, программы, загрязнения и проч. Для аденина есть свой маленький пик в хроматограмме обратной последовательности, так что буквы пропущено не было. Это также подтверждает прямая последовательность.

Задание 2. Пример нечитаемого участка хроматограммы

рис.7 Нечитаемый участок хроматограммы
На рисунке 7 видно, что начальный учаток последовательности не распознан. Пики размытые, они очень сильно накладываются друг на друга. Где-то пики одного цвета не разделены четко. Понять, где шум, а где нужный сигнал, не представляется возможным.

© Нестеренко Екатерина 2018