Задание 1

Обработка ридов и получение косенсусной последовательности

Исходные последовательности в формате fasta:

08_F.fa

08_R.fa

Затем реверс последовательность была отражена и преобразована в комплементарную:

08_R_revcomp.fa

Консенсусная последовательность была найдена при прогоне исходных .ab1 файлов через программу Pearl:

pearl08.fa

После чего все 3 fasta файла были выровнены в Jalview:

Готово.jvp

Готово.fa

Ручная правка ридов

В ходе работы было замечено, что Pearl куда более чувствителен и зачастую опознает основание там, где UGENE сомневается. При этом решения, принятые Pearl являются правильными, что было проверено сверкой со второй последовательностью

В случае же работы с UGENE абсолютное большинство полиморфизмом может быть исправлено путем сверения с реверс-ридом, так как шанс попадания полиморфизма в одно основание в обоих ридах крайне мала:

Общий анализ хроматограммы

08_F.ab1

08_R.ab1

1) Нечитаемые участки хроматограммы примерно 15-20 пар оснований в начале рида, и 40-50 пар в конце.

2) Хроматограмма достаточно шумная - амплитуда пиков шума систематически составляет до трети амплитуды пиков сигнала. Уровень шума примерно равен для всей читабельной части последовательности.

3) Присутствуют пятна краски - в среднем по 2 значительных пятна на рид.

4) Проскальзываний полимеразы не обнаружено.

Задание 2

Анализ дефектного участка хроматограммы

Данный участок взят из самого конца 08_F.ab1, на нем мы можем видеть крайне неясные пики, сложные для опознания даже визуально. Предположительно причиной этого явлляется не повышенный шум, а наложение пиков друг на друга вследствие смешения красителя из-за особенностей ПЦР ДНК - длинные цепочки ДНК различаются при помощи ПЦР значительно хуже, чем короткие.