Чтение последовательностей по Сэнгеру.



Задание 1. Анализ хроматограмм последовательности ДНК на основании данных, полученных из капиллярного секвенатора.

Были проанализированы хроматограммы прямого прочтения: Ae1_18SII_F_D05_WSBS-Seq-1-08-15.ab1
и обратного: Ae1_18SII_R_D06_WSBS-Seq-1-08-15.ab1 .
Были найдены нечитаемые участки:
В прямой последовательности: 5' - 1 - 50 - 3' и 5' - 719 - 930 - 3'.
В обратной последовательности: 5' - 1 - 52 - 3' и 5' - 741 - 951 - 3'.
В целом читаемые участки хроматограмм хорошего качества, шум много меньше сигнала и редко совпадает с ним, сила сигнала неодинакова по всей длине, в отличие от силы шума. Рассмотрим проблемные участки поближе. К обратной последовательности перед выравниванием применили функцию Reverse + Complement.

 Ae1_18SII_F_D05_WSBS-Seq-1-08-15.ab1     Ae1_18SII_R_D06_WSBS-Seq-1-08-15.ab1

Здесь можно заметить 2 спорных участка обратного прочтения, сравнив их с соответствующими участками в прямом прочтении, можно сделать вывод, что это проблемные нуклеотиды и заменить N-68 и N-69 на c.

Ae1_18SII_F_D05_WSBS-Seq-1-08-15.ab1   Ae1_18SII_R_D06_WSBS-Seq-1-08-15.ab1

Здесь аналогично в обратном прочтении можно идентифицировать неизвестный нуклеотид и заменить N-86 на a.

Ae1_18SII_F_D05_WSBS-Seq-1-08-15.ab1     Ae1_18SII_R_D06_WSBS-Seq-1-08-15.ab1

Вновь спорный нуклеотид N-248 в прямом прочтении можно определить как t.

Ae1_18SII_F_D05_WSBS-Seq-1-08-15.ab1    Ae1_18SII_R_D06_WSBS-Seq-1-08-15.ab1

Здесь на месте N-199 в обратном прочтении можно определить спорный нуклеотид c.

Затем отредактированные последовательноси были сохранены в формате fasta:
прямая последовательность - direct.fasta;
обратная последовательность - reverse.fasta.
Они были выровнены программой needle: ae1.fasta.
Это выравнивание было импортировано в Jalview и раскрашено по нуклеотидам: chromatogramm.jvp.
Задание 2. Обзор нечитаемого фрагмента хроматограммы.



Для примера был взят нечитаемый 3'-участок прямой последовательности Ae1_18SII_F_D05_WSBS-Seq-1-08-15.ab1 . Здесь пики сливаются друг с другом, они широкие и размытые, непериодичные, из-за их наложения невозможно идентифицировать нуклеотиды.


©Makarikova Olga 2018