Секвенирование по Сэнгеру

~mashkovskayaav


◊ В результате секвенирования ДНК по Сэнгеру создается хроматограмма, показывающаяя приблизительный нуклеотидный состав молекулы. Для выполенения работы были взяты прямая и обратная хроматограммы ДНК (обратная хроматограмма перевернута с помощью команды Reverse программы Chromas).

Исходные хроматограммы:

L33_COI_F - прямая хроматограмма

L33_COI_R - обратная хроматограмма

◊ Начало и концы каждой хроматограммы нечитаемы из-за особенностей метода секвенирования, поэтому перед выравниванием они были удалены.

# Удаленные нуклеотиды начала Удаленные нуклеотиды конца
Прямая хроматограмма (F) 1-151 501-570
Обратная хроматограмма (R) до команды Reverse 1-170 480-543

В целом, качество хроматограмм хорошее, средние участки очень близки к идеальным вариантам хроматограмм:

А) Есть нуклеотиды, где пики хроматограмм выпадают по высоте из общей массы, но таких нуклеотидов немного
Б) Уровень шума невысокий

При приближении к концам хроматограмм качество существенно падает, многие пики начинают сливаться, уровень шума возрастает, появляется гораздо больше проблемных нуклеотидов. Концы хроматограммы нечитаемы.


Исправления

1. Проблемные нуклеотиды 23 и 25 прямой хроматограммы (рис.1)

Рисунок 1

В изначальной прямой хроматограмме эти нуклеотиды не опознаны, поэтому они были исправлены на нуклеотиды t и g в соответствии с обратной хроматограммой, где пики четкие, а уровень шума низкий (рис. 2).

Рисунок 2

На прямой хроматограмме эти нуклеотиды не отображаются из-за того, что уровень шума совпал с сигналом реальныъ нуклеотидов.ССЫЛКА2

2. Проблемные нуклеотиды 44 и 49 прямой хроматограммы

В данном случае нуклеотиды появляются также из-за высокого уровня шума (широкий синий сигнал на рисунке 3). Последовательность испралена в соответствии с обратной хроматограммой.

Рисунок 3

3. Проблемные нуклеотиды 334, 336, 341, 341, 343, 350 прямой хроматограммы (рисунок 4)

Рисунок 4

- Нуклеотид 334 прямой хроматограмме обозначен как неопознанный, хотя уровень шума достаточно невелик. Значение также было проверено по обратной хроматограмме

- Нуклеотиды 336 и 341-343 были проверены по обратной хроматограмме

- Нуклеотид 350 не был опознан на обеих хроматограммах из-за высокого уровня шума, однако его вполне можно принять за тимин.

4. Проблемный нуклеотид 315 обратной хроматограммы (после команды Reverse)

Хотя уровени реального сигнала и сигнала "шума" очень близки, все же предполагается, что это не полиморфизм, поскольку уровень шума в конкретном нуклеотиде сопоставим с уровнем шума в его ближайшем окружении (рис.5)

Рисунок 5

К сожалению, ярко выраженных полиморфизмов в хроматограммах обнаружено не было.

◊ Прямая отредактированная последовательность (FASTA)
◊ Обратная отредактированная последовательность (FASTA)
◊Выравнивание needle в формате (FASTA)
◊Проект jalview ДО и ПОСЛЕ редактирования проблемных нуклеотидов


Нечитаемая хроматограмма

◊ Хроматограмма L49_COI_F была рассмотрена в качестве нечитаемой. В данной хроматограмме по большей части виден лишь шум с некоторыми выбивающимися группами высоких пиков (рис.6).

Рисунок 6

Фрагменты, где все же немного прослеживаются сигналы, нечитаемы из-за того, что сигналы накладываются друг на друга и перекрываются с шумом (рис.7)

Рисунок 7

©Машковская Анна, 2018