При помощи программы Ugene была собрана консенсусная последовательность из прямого и обратного ридов, полученных методом секвенирования по Сэнгеру. Консенсус можно скачать по ссылке. Основой проблемой было получение референсной последовательности. Для этого алгоритм получения консенсуса на основе хроматограмм запустили дважды. Консенсус первого запуска стал референсной последовательностью для второго (в первый раз референсом выбрали последовательность хроматограммы с прямого праймера). Выравнивание референсной последовательности (2-ой консенсус) и последовательностей хроматограмм можно скачать по ссылке.
Прямая хроматограмма. Нечитаемые участки 1-18 и 376-379. В среднем примерный уровень шумов на хроматограмме низкий по отношению к сигналу. Их высокий уровень наблюдается ожидаемо в начале и конце хроматограммы. Редки случаи возникновения посторонего сигнала в хроматограмме. Можно сказать, что качество данных хорошее.
Обратная хроматограмма. Нечитаемые участки 1-32 и 380-384. В данной хроматограмме "на глаз" средний уровень шумов выше, чем в предыдущей, по отношению к сигналу. Наиболее трудно читаемые участки из-за шума расположены в начале и конце хроматограммы. Также прочтение содержит участок с повышенным уровнем ошибочного сигнала, может быть, в следствие отрыва отрыва флуорофора.
Проблема данной хроматограммы в том, что происходит наложение множества пиков на другие. Эта ситуация наблюдается на протяжение всей хроматограммы, поэтому можно предположить контаминицию, в образце была ДНК нескольких организмов.