Отчёт по практикуму 6

Секвенирование по Сэнгеру

В шестом задании надо расшифровать хроматограмму и показать, какие участки бы не расшифровались.

Получение последовательности ДНК по хроматограмме

Для получения консенсусной последовательности файлы *.ab1 были открыты в Chromas, проблемные нуклеотиды помечены, потом экспортированые последовательности выровнены:

Проблемы оказалось легко исправить по комплементарной цепи, и результат даже совпадал с интуитивно желаемым по хроматограмме. Консенсусная последовательность скопирована построчно из выравнивания в формате needle.

Скачать консенсусную последовательность. Доступны также файл с выравниванием (в формате fasta) и исходные файлы ab1: 24_F.ab1, 24_R.ab1.

Охарактеризуем хроматограмму. Вот что о ней можно сказать:

Разберём несколько проблемных участков хроматограммы (рисунки 1–4).

первая проблема
Рисунок 1. Затёки в верхней хроматограмме

Видно, что «красная» и «синяя» краски разлились бесконтрольно, но это не убрало пики других цветов, хоть и превысило. Картина восстанавливается по выравниванию.

вторая проблема
Рисунок 2. Не распознан гуанин на 396 позиции верхней хроматограммы.

Он там очевиден даже без выравнивания.

третья проблема
Рисунок 3. Не распознан тимин в 598 позиции внизу из-за высокого уровня шума гуанина.

Опять-таки выравнивание, хоть и помогает, не строго необходимо.

четвёртая проблема
Рисунок 4. Затёк краски гуанина скрыл два пика, их пришлось проверять по верхней хроматограмме.

А здесь понадобилось выравнивание.

На концах возникли неразрешённые вопросы с полиморфизмами, они так и попали в консенсус. Были оставлены варианты вида «пурин» и «пиримидин», так как в принципе цитозин в одной из цепей мог перейти в тимин (дезаминирование).

Нечитаемый фрагмент хроматограммы

Возьмём некачественный фрагмент, в данном случае — из начала файла 24_F.ab1.

Он показан на рис. 5.

не прочтёшь
Рисунок 5. Нечитаемое начало прямой цепочки

Здесь наблюдаются пики. Проблема интерпретации не в их отсутствии, а в том, что пики сравнимой высоты есть сразу нескольких цветов. И даже ближе к концу, когда остаётся только синий C, границы пика не очерчены и трудно сказать, сколько цитозинов на самом деле (судя по обратному прочтению, их должно быть три — столько и указано в консенсусной последовательности).

Итак, проанализированы результаты секвенирования по Сэнгеру. С хорошей точностью была расшифрована последовательность центрального участка ДНК, и даже на концах удалось прочесть что-то сверх аннотированного автоматически.