1.Чтение последовательности ДНК на основании данных, полученных из капилярного секвенатора по Сэнгеру.

С помощью программы Chromos была просмотрена и отредактирована последовательность ДНК. Исходные файлы : прямая цепь и комплементарная.

  1. 5' нечитаемый участок на прямой цепи : 1-55
  2. 3' нечитаемый участок на прямой цепи : 666-943 (Стоит отметить, что проблемы с чтением участка начинаются гораздо раньше — в районе 613 нуклеотида)
  3. 5' нечитаемый участок на комплементарной цепи : 1-34
  4. 3' нечитаемый участок на комплементарной цепи : 712-945

С помощью программы Continuous edit были удалены нечитаемые 5' и 3' концы. Прямая и комплементарная последовательности без нечитаемых участков. При удалении нечитаемых участков прямой и комплементарной цепей нумерация нуклеотидов сдивагается соответственно.

Прямая последовательность в формате fasta; Комплементарная последовательность в формате fasta; Выравнивание в Jalview.

Оценка качества хроматограммы прямой цепи.

  • В среднем сигнал шума мал по сравнению с основным сигналом (примерно раз в 5). Как правило, шумовой сигнал, наблюдаемый на хромотограмме, порождается аналого-цифровым преобразователем, детектором, потоком элюента и т. д.

  • Амплитуда и период сигнала относительно равномерны, за исключением нечитаемых участков.

  • Высокая амплитуда сигнала — A, G. Ниже у — T, C. Данный факт может быть обусловлен различной химической природой флуорофоров; при автоматическом секвинировании обычно используются такие флуорофоры, абсорбция и спектр излучения которых варьирует в диапозоне длин вол 450-650нм в зоне видимого спектра и 650-825нм в ближней инфракрасной зоне спектра.

Проблемные места хроматограммы прямой цепи.

  • Нераспознанный сигнал.
    1. 44 N — из хроматограммы очевидно, что это Т
    2. 116 N → 116 T
    3. 121 N → 121 C
    4. 154 N → 154 C
    5. 246 N → 246 T
    6. 278 N → 278 T
    7. 420 N → 420 A
    8. 524 N → 524 T

    Рис1. Пример нераспознанного сигнала в прямой цепи (хроматограмма без удаленных нечитаемых участков)

  • Наложение пиков шума и основного сигнала.
    1. 104 N — при проверке этого участка на комплиментарной цепи видно, что там А.
    2. 242 N → 242 A
    3. 469 N → 469 A
    4. 528 N → 528 A
    5. 534 N → 534 A
    6. 559 N → 559 G
    7. 574 N → 574 G

    Во всех вышеперечисленных 7 случаях полиморфизма не наблюдается. Действительно, наложение пиков идет из-за шума, а не в силу наложения отдельных сигналов.

    Рис2. Пример наложения пиков от шума и сигнала. (хроматограмма без удаленных нечитаемых участков)

  • Пятно краски - Не обнаружено в читаемой области.
  • Лишний нуклеотид - Не обнаружен в читаемой области.

Оценка качества хроматограммы комплементарной цепи.

  • В среднем сигнал шума мал по сравнению с основным сигналом.
  • За исключением краевых областей, амплитуда сигнала равномерна вдоль всей оси.
  • Высокие пики у C,T; низкие у A, G.

Проблемные места хроматограммы комплементарной цепи.

  • Нераспознанный сигнал.
  1. 12 N — из хроматограммы очевидно, что это G.
  2. 309 N → 309 A
  3. 638 N → 638 G
  4. 673 N → 673 С
  5. 687 N → 687 T

Рис3. Пример нераспознанного сигнала в комплементарной цепи(снизу) (хроматограмма без удаленных нечитаемых участков)

  • Наложение пиков шума и основного сигнала.
  1. 5N, 6 N — при проверке этого участка на прямой цепи (с применением опции Reverse-ompliment) к сожалению, из-за трудности в прочтении нельзя однозначно сказать, сигнал от какого ddNTP+fluorophore привалирует в большей степени.

Признаков полиморфизма, как и в случае с прямой цепью, замечано не было.

  • Пятно краски - Не обнаружено в читаемой области.
  • Лишний нуклеотид - Не обнаружен в читаемой области.

Рис4. Пример хорошо читаемого региона в прямой и комплементарной цепях соответственно.

Перед тем как перевести файл с последовательностями в формат fasta, цепи отредактировали : замена N на соответствующий нуклеотид (маленькой буквой), за исключением позиции 5N и 6N в комплиментарной цепи.

С помощью программы JalView было сделанно выравнивание последовательностей.

2. Пример не читаемого фрагмента хроматограммы.

В качестве примера была выбранна хроматограмма L49_COI_F_F05_WSBS-Seq-07-10-16.ab1.

Как видно из рисунка, пики наслаиваются друг на друга, а потом затухают. Подобный результат мог дать продукт, недостаточно очищеный от ПЦР праймеров (таким образом они будут конкурировать в реакции сиквенса) или же продукт, загрязненный димерами, которые одновременно с ним секвенируются. Не стоит искючать и возможность того, что ПЦР продукт мог изначально быть гетерогенным.