Задание 1. Анализ хроматограмм последовательности ДНК на основании данных,
полученных из капиллярного секвенатора.
Были проанализированы хроматограммы прямого прочтения: Ae1_18SII_F_D05_WSBS-Seq-1-08-15.ab1
и
обратного: Ae1_18SII_R_D06_WSBS-Seq-1-08-15.ab1
.
Были найдены нечитаемые участки:
В прямой последовательности: 5' - 1 - 50 - 3' и 5' - 719 - 930 - 3'.
В обратной последовательности: 5' - 1 - 52 - 3' и 5' - 741 - 951 - 3'.
В целом читаемые участки хроматограмм хорошего качества, шум много меньше сигнала и редко совпадает с
ним, сила сигнала неодинакова по всей длине, в отличие от силы шума. Рассмотрим проблемные участки
поближе. К обратной последовательности перед выравниванием применили функцию Reverse + Complement.

Ae1_18SII_F_D05_WSBS-Seq-1-08-15.ab1 Ae1_18SII_R_D06_WSBS-Seq-1-08-15.ab1
Здесь можно заметить 2 спорных участка обратного прочтения, сравнив их с соответствующими участками в
прямом прочтении, можно сделать вывод, что это проблемные нуклеотиды и заменить N-68 и N-69 на c.

Ae1_18SII_F_D05_WSBS-Seq-1-08-15.ab1 Ae1_18SII_R_D06_WSBS-Seq-1-08-15.ab1
Здесь аналогично в обратном прочтении можно идентифицировать неизвестный нуклеотид и заменить N-86
на a.

Ae1_18SII_F_D05_WSBS-Seq-1-08-15.ab1 Ae1_18SII_R_D06_WSBS-Seq-1-08-15.ab1
Вновь спорный нуклеотид N-248 в прямом прочтении можно определить как t.

Ae1_18SII_F_D05_WSBS-Seq-1-08-15.ab1 Ae1_18SII_R_D06_WSBS-Seq-1-08-15.ab1
Здесь на месте N-199 в обратном прочтении можно определить спорный нуклеотид c.
Затем отредактированные последовательноси были сохранены в формате fasta:
прямая последовательность - direct.fasta;
обратная последовательность - reverse.fasta.
Они были выровнены программой needle: ae1.fasta.
Это выравнивание было импортировано в Jalview и раскрашено по нуклеотидам:
chromatogramm.jvp.
Задание 2. Обзор нечитаемого фрагмента хроматограммы.

Для примера был взят нечитаемый 3'-участок прямой последовательности Ae1_18SII_F_D05_WSBS-Seq-1-08-15.ab1
. Здесь пики сливаются друг с другом, они широкие и размытые, непериодичные, из-за их наложения невозможно
идентифицировать нуклеотиды.