Dzha_sanger

Чтение последовательностей по Сангеру

Задание 1. Чтение последовательности ДНК на основании данных, полученных из капиллярного секвенатора по Сэнгеру. Обзор проблем, возникающих при чтении хроматограмм.

Файлы данного задания:

Для просмотра хроматограмм и редактирования автоматического прочтнения использовалась программa Chromas (Lite).

Характеристика хроматограммы прямой цепи:

Характеристика хроматограммы обратной цепи (здесь и далее использовалась комплементарная цепь):


Редактирование последовательностей

В хроматограммах возникают некоторые полиморфизмы, то есть какие-то нуклеотиды не могут быть автоматически определены из-за посторонних сигналов - шумов. Полиморфизмы обозначаются кодами вырожденных нуклеотидов (ambiguity codes) - W: A или T; S: G или C; и т.п.

В хроматограммах данных мне последовательностей в основном встречаются следующие вырожденные коды: N(G,A,T,C) и S(G,C), эти коды заменялись нуклеотидами, которые были определены в другой последовательности. (см. табл.1)


Таблица 1.Редактирование последовательностей.
ПроблемаИзображение
Из-за высокого уровня шума в прямой цепи (вверху) не определены 2 нуклеотида (N - G,A,T,C; S - G или C).
Неопределенные нуклеотиды можно восстановить по обратной цепи (внизу).
Здесь, вероятно, слишком сильные сигналы перекрывают остальные слабые сигналы, пики которых по высоте сравнимы с пиками шума.

Задание 2. Пример нечитаемого фрагмента хроматограммы.


sad story
рис.1. Нечитаемый фрагмент.

Изображенный вверху фрагмент хроматограммы нельзя считать достоверным, так как слишком частые сигналы шумов сравнимы с сигналами нуклеотидов.