Задание 1. Получение последовательности ДНК по данным из капиллярного секвенатора. Проблемы при чтении хромотограмм.
Для работы с хроматограммами использовалась программа UGENE.
Консенсусная последовательность
Прямая последовательность
Обратная последовательность
Исходное выравнивание
Исправленное выравнивание
Сначала последоательности были загружены в UGENE и были выровнены относительно обратной. Полученный референс
Далее были исправлены ошибки в обоих чтениях (примеры ошибок на рисунках ниже).
Конечный результат выравнивания
Были вырезаны нечитаемые концевые участки: 129 нуклеотидов в начале и 80 в конце обратной цепи, и 7 нуклеотидов в начале и 129 в конце прямой цепи.
Был выставлен порог качества для обрезания концов 25%, потому что при меньшем пороге концы оставались нечитаемыми. Концы, удаленные программой, оказались длиннее.
Ближе к концам шум усиливается, нормально читаемые участки хроматограммы довольно короткие из-за высокго уровня шума на протяжении всего участка. Отношение сигнала к шуму во многих местах 3:1. Наиболее часто встречаемый нуклеотид последовательности - тимин.
![]()
Pic.1 626-631 нуклеотиды прямой последовательности. Шум выше среднего На данном участке из-за высокого уровня шума на прямой последовательности правильной будем считать обратную последовательность, где уровень шума гораздо ниже.
![]()
Pic.2 639-642 нуклеотиды обратной последовательности. Соседние пики нетипично удалены Этот участок находится ближе к концу поседовательности, консеснусным чтением будем считать прямую последовательность.
![]()
Pic.3 345 нуклеотид прямой последовательности, неправильное прочтение пика программой В данном случае вручную исправляем непрочитанный нуклеотид, указывая нужный по обратной последовательности, 345 нуклеотид - это аденин.
![]()
Pic.4 171 нуклеотид обратной последовательности, наложение пиков Для 171 нуклеотида видны 2 пика, судя по прямому чтению, это все же аденин.
Задание 2. Нечитаемый фрагмент хроматограммы
![]()
Этот фрагмент мог возникнуть из-за ошибок во время фореза, переизбытка гуанина или элементарно из-за сбоя в работе секвенатора.