Анализ секвенирования по Сенгеру

В данном практикуме с помощью программы Ugene анализируются прямое и обратное прочтение некоторой последовательности с целью получить контиг.

1. Чтение хроматограммы и сборка последовательнсти

Исходные файлы: прямой рид, обратный рид
Контиг: консенсусная последовательность в fasta-формате
Выравнивания: неотредактированных ридов с контигом, отредактированных ридов с референсом
В качестве референсной была взята последовательность Macoma balthica voucher 07PROBE-05510 cytochrome oxidase subunit 1 (COI) gene (GeneBank: KF643760.1) полученная с помощью blastn и консенсусной последовательности.

Заменяем N на T по прямому прочтению
Заменяем N на G по прямому прочтению
Заменяем N на A по прямому прочтению
Заменяем N на A по прямому прочтению
Заменяем N на A по прямому прочтению

Характеристики хроматограммы

Качество сигнала

Ниже приведен график, изображающий уровень Phred для каждого нуклеотида для прямого и обратного прочтений, по которому можно видеть, что наибольший уровень качества сигнала достигается в середине хроматограммы, а в её начале и конце качество падает.
Среднее качество сигнала для прямого прочтения - 21.9, а для обратного - 25.6.

Неравномерность сигнала и шума

Высоты пиков в серединной области прямого прочтения примерно одинаковы, в то время как в обратном прочтении пики гуанина значительно превышают высоту остальных пиков.
В начале и конце каждого из прочтений находятся беспорядочные области, встречаются очень высокие и широкие пики, которые, возможно, отражают пятна красителей, однако в серединной области все пики выравниваются по высоте и нахоятся на одинаковом расстоянии друг от друга, при этом уровень шума (других сигналов) в большинстве случаев не привышает половины высоты пика. Иногда встречаются слившиеся друг с дргом пики, но это не затрудняет прочтение хроматограммы.

Нечитемый фрагмент хроматограммы

В качестве нечитаемого был взят фрагмент 1-98 из хроматограммы L49_COI_R_F06_WSBS-Seq-07-10-16. В данном фрагменте все пики сигнала беспорядочно перекрываются и сливаются между собой, из-за чего представляется невозможным определить, от какого нуклеотида исходит сигнал, что, вероятно, является результатом отжига праймеров на короткие неспецифичные участки. Также в данном фрагменте присутсвует участок с очень высокими и широкими пиками, котрые могли появиться в результате загрязнения пятнами красителя.