Исходные последовательности в формате fasta:
Затем реверс последовательность была отражена и преобразована в комплементарную:
Консенсусная последовательность была найдена при прогоне исходных .ab1 файлов через программу Pearl:
После чего все 3 fasta файла были выровнены в Jalview:
В ходе работы было замечено, что Pearl куда более чувствителен и зачастую опознает основание там, где UGENE сомневается. При этом решения, принятые Pearl являются правильными, что было проверено сверкой со второй последовательностью
В случае же работы с UGENE абсолютное большинство полиморфизмом может быть исправлено путем сверения с реверс-ридом, так как шанс попадания полиморфизма в одно основание в обоих ридах крайне мала:
1) Нечитаемые участки хроматограммы примерно 15-20 пар оснований в начале рида, и 40-50 пар в конце.
2) Хроматограмма достаточно шумная - амплитуда пиков шума систематически составляет до трети амплитуды пиков сигнала. Уровень шума примерно равен для всей читабельной части последовательности.
3) Присутствуют пятна краски - в среднем по 2 значительных пятна на рид.
4) Проскальзываний полимеразы не обнаружено.
Данный участок взят из самого конца 08_F.ab1, на нем мы можем видеть крайне неясные пики, сложные для опознания даже визуально. Предположительно причиной этого явлляется не повышенный шум, а наложение пиков друг на друга вследствие смешения красителя из-за особенностей ПЦР ДНК - длинные цепочки ДНК различаются при помощи ПЦР значительно хуже, чем короткие.