Секвенирование по Сэнгеру


Задание 1. Получение последовательности ДНК по данным из капиллярного секвенатора. Проблемы при чтении хромотограмм.

Для работы с хроматограммами использовалась программа UGENE.


Консенсусная последовательность
Прямая последовательность
Обратная последовательность
Исходное выравнивание
Исправленное выравнивание

Сначала последоательности были загружены в UGENE и были выровнены относительно обратной. Полученный референс
Далее были исправлены ошибки в обоих чтениях (примеры ошибок на рисунках ниже).
Конечный результат выравнивания


Были вырезаны нечитаемые концевые участки: 129 нуклеотидов в начале и 80 в конце обратной цепи, и 7 нуклеотидов в начале и 129 в конце прямой цепи.

Был выставлен порог качества для обрезания концов 25%, потому что при меньшем пороге концы оставались нечитаемыми. Концы, удаленные программой, оказались длиннее.

Ближе к концам шум усиливается, нормально читаемые участки хроматограммы довольно короткие из-за высокго уровня шума на протяжении всего участка. Отношение сигнала к шуму во многих местах 3:1. Наиболее часто встречаемый нуклеотид последовательности - тимин.


Pic.1 626-631 нуклеотиды прямой последовательности. Шум выше среднего

На данном участке из-за высокого уровня шума на прямой последовательности правильной будем считать обратную последовательность, где уровень шума гораздо ниже.



Pic.2 639-642 нуклеотиды обратной последовательности. Соседние пики нетипично удалены

Этот участок находится ближе к концу поседовательности, консеснусным чтением будем считать прямую последовательность.



Pic.3 345 нуклеотид прямой последовательности, неправильное прочтение пика программой

В данном случае вручную исправляем непрочитанный нуклеотид, указывая нужный по обратной последовательности, 345 нуклеотид - это аденин.



Pic.4 171 нуклеотид обратной последовательности, наложение пиков

Для 171 нуклеотида видны 2 пика, судя по прямому чтению, это все же аденин.



Задание 2. Нечитаемый фрагмент хроматограммы


Этот фрагмент мог возникнуть из-за ошибок во время фореза, переизбытка гуанина или элементарно из-за сбоя в работе секвенатора.