В результате работы были полученна консенсусная последовательность (consensus.fa) и выравнивание прямой, обратной последовательностей, а также референса (alignment.fa)
В ходе работы были найдены несколько проблемных нуклеотидов. На рис.1-3 показазаны полиморфизмы (сила второго сигнала в той же позиции больше 2/3 первого или равна силе первого), а на рис.4 показан участок с пятном краски, последовательность которого восстанавливалась в основном по второй цепочке.
Здесь виден пик G и пик T, высота которого составляет примерно 2/3 от высоты первого, что говорит о полиморфизме.
Здесь на обоих цепях мы видим полиморфизм A/T.
Здесь на второй цепи произошло размытие краски A, что смазало сигнал от C, по первой цепи и по пикам на второй мы понимаем, что там на самом деле C.
Длины начального и конечного трудно читаемых участков для прямого и обратного прочтений: F – 35, R – 19.
Оценка (на глаз) отношения сигнала и шума в среднем: 20:1
Неравномерность силы сигнала и шума вдоль последовательности (на глаз): доля шума выше на концах последовательности, в середине последовательности иногда возникают участки длиной в несколько нуклеотидов с повышенным шумом, вызванные разливом краски
Ссылки на исходные файлы:
35_F.ab1
35_R.ab1
Была взята хроматограмма из файла L43_COI_F_C05_WSBS-Seq-07-10-16.ab1. На этом фрагменте можно видеть пятно краски, также можно отметить, что расстояние между пиками разное, и некоторые пики лежат между , предсказанными программой, мест нуклеотидов.