Секвенирование по Сэнгеру: обработка хроматограмм

Получение последовательности ДНК на основании данных, полученных из капиллярного секвенатора

Полученная последовательность: 48_seq.fasta
Выравнивание прямой и обратной последовательностей: 48_al.fasta
Примеры проблемных нуклеотидов см. рис. 1-3.
В целом, хроматограммы хорошие. Для прямого прочтения длина начального нечитаемого участка ~19 нуклеотидов, конечного ~44 нуклеотида. Для обратного прочтения ~10 в начале и ~23 в конце. Однако, например, часть конечного нечитаемого участка обратного прочтения можно восстановить по прямому прочтению.
Соотношение сигнала и шума в среднем где-то 5:1, причем в прямом прочтении уровень шума выше, чем в обратном. Сила сигнала более-менее постоянная, кроме начального и конечного участков.

Изображение не найдено. Вы можете сообщить об этом: daniil.bobrovsky@fbb.msu.ru
Рис. 1. В обоих случаях проблемный нуклеотид без труда восстанавливается как по комплементарной последовательности, так и по хроматограмме.
Изображение не найдено. Вы можете сообщить об этом: daniil.bobrovsky@fbb.msu.ru
Рис. 2. В обоих случаях проблемный нуклеотид без труда восстанавливается как по комплементарной последовательности, так и по хроматограмме.
Изображение не найдено. Вы можете сообщить об этом: daniil.bobrovsky@fbb.msu.ru
Рис. 3. В обоих случаях в прямой последовательности лишний гуанин. По обратной последовательности прекрасно видно, что его можно спокойно удалить.

Пример нечитаемого фрагмента хроматограммы

Изображение не найдено. Вы можете сообщить об этом: daniil.bobrovsky@fbb.msu.ru
Рис. 4. На этой хроматограмме сигнал неразличим, сплошной шум.