Секвенирование по Сэнгеру

Восстановление последовательности по хроматограмме

Анализ хроматограмм

Исходные хроматограммы прямого и обратного прочтений

Выравнивание отредактированных прямого и reverse-complement обратного прочтений
Комментарий: Строчными буквами в каждой последовательности отмечены нуклеотиды, которые секвенатор не смог определить и которые приходилось определять вручную по прочтению комплементарной цепи, или которые, хотя и были определены секвенатором, вызывали ожидания полиморфизма на прочтении комплементарной цепи (из-за шума около и более половины основного сигнала на данной цепи) и также требовали проверки. Трудночитаемые концевые последовательности определены и удалены на обеих последовательностях автоматически.

Консенсусная последовательность
Комментарий: Строчные буквы из выравнивания замены на обычные прописные.

Характеристика хроматограммы

Для прямого прочтения программа определяет нечитаемую 5'-концевую последовательность длиной ≈177 bp (координаты 1:177), хотя с 131 нуклеотида хроматограмма кажется вполне читаемой (кажущаяся длина 130 bp), и нечитаемую 3'-концевую последовательность длиной ≈56 bp (координаты 661:716), что совпадает с определением этого участка на глаз.
Для обратного прочтения (без reverse-complement) программа определяет нечитаемую 5'-концевую последовательность длиной ≈161 bp (координаты 1:161), хотя хроматограмма читаема уже с 134 нуклеотида (кажущаяся длина 133 bp), и нечитаемую 3'-концевую последовательность длиной ≈39 bp (координаты 670:709), но начиная с 647 нуклеотида, некоторые соседние пики становятся трудноразличимыми (кажущаяся длина 62 bp).

Как для прямого, так и для обратного прочтений уровень шума редко превышает половину уровня сигнала, находясь в среднем по последовательности на уровне около 30% от уровня сигнала для прямого прочтения и около 20% от уровня сигнала для обратного прочтения.

Для обоих прочтений уровень сигнала на коротких последовательностях (около 20 нуклеотидов) обычно сильно варьирует (до 3-кратного различия). Однако если взять среднее значение сигнала на таких коротких последовательностях, оно будет примерно одинаковым на всей хроматограмме. Уровень шума подчиняется примерно такой же зависимости. Также можно заметить, что уровень сигнала и уровень шума несколько повышаются ближе к 3'-концу хроматограмм; для уровня шума это связано с расширением пиков сигналов, вызваного плохим качеством электрофореза для длинных молекул.

Некоторые трудные места

Комментарий: Нумерация нуклеотидов совпадает с нумерацией в отредактированных хроматограммах. Нумерация в прямой последовательности совпадает с нумерацией в консенсусной последовательности.

  1. Описание Нуклеотид 11 прямого прочтения был определён секвенатором как T, но из-за шума сигнала C с уровнем в половину уровня основного сигнала T вызывает подозрение возможности полиморфизма на обратном прочтении; на обратном прочтении полиморфизма не найдено, сильный сигнал T. Вывод: нуклеотид был правильно определён как T.
    Нуклеотид 13 прямого прочтения был обозначен секвенатором как неопределённый N из-за шума в половину уровня основного сигнала A; на обратном прочтении наблюдается чистый сигнал A. Вывод: нуклеотид A.
    Прямое прочтение со сложным участком
    Обратное прочтение участка
  2. Описание Нуклеотид 90 прямого прочтения был определён секвенатором как A, но наличие шума от сигнала G уровнем около 70% от уровня основного сигнала A заставляет заподозрить полиморфизм; на обратном прочтении имеется сильный сигнал A без шума. Вывод: нуклеотид был определён верно как A.
    Нуклеотид 92 прямого прочтения был обозначен секвенатором как неопределённый N из-за шума сигнала A уровнем более половины уровня основного сигнала G; на обратном прочтении наблюдается чистый сильный сигнал G. Вывод: нуклеотид G.
    Прямое прочтение со сложным участком
    Обратное прочтение участка
  3. Описание Нуклеотид 265 обратного прочтения (соответствует нуклеотиду 97 прямого прочтения) был обозначен секвенатором как неопределённый N из-за шума сигнала A уровнем в половину основного сигнала T; на прямой последовательности шум не сильный и в этой позиции обусловлен в основном шумом сигнала G, наблюдается уверенный сигнал T. Вывод: нуклеотид T.
    Прямое прочтение участка
    Обратное прочтение со сложным участком
  4. Описание А здесь много всего сразу.
    Нуклеотиды 140 и 141 прямого прочтения секвенатор определяет как T и A соответственнно, но значительный уровень шума на этом участке заставляет задуматься; на обратном прочтении видны чистые и сильные сигналы T и A соответсвенно. Вывод: нуклеотиды были определены верно как T и A.
    Нуклеотид 142 прямого прочтения был обозначен секвенатором как неопределённый N из-за сигнала G, превышающего половину уровня основного сигнала A; на обратном прочтении наблюдается сильный сигнал A без шума. Вывод: нуклеотид A.
    Нуклеотид 143 прямого прочтения определён секвенатором как T, но из-за достаточно сильного шума сигнала A хочется посмотреть на обратное прочтение; на обратном прочтении виден сильный сигнал T с незначительным шумом. Вывод: нуклеотид определён верно как T.
    Нуклеотид 145 обозначен секвенатором как неопределённый N и действительно похож на полиморфизм, поскольку оба сигнала (G и A) имеют примерно одинаковый уровень, к тому же основной сигнал (G) достаточно слабый по сравнению с окружением; на обратном прочтении виден сильный сигнал G с незначительным шумом. Вывод: нуклеотид G.
    Прямое прочтение со сложным участком
    Обратное прочтение участка

Пример нечитаемого участка хроматограммы

На 5'-конце исходной хроматограммы обратного прочтения (15_R.ab1) имеем пятно краски: пятна "цитозинового" и "тиминового" красителей делают участок около позиции 120 практически нечитаемым (сложно согласиться с решением секвенатора), хотя его окружение вполне интерпретируемо.




Методы

Для работ с хроматограммами использоалась программа Chromas(Lite). Для создания выравнивания отредактированных последовательностей и консенсусной последовательности использовалась программа Jalview; регистр символов в консенсусной последовательности отредактирован скриптом bash tr. Для создания изображений использовался Paint.

Главная страница


© Степан Пухов

2019