◊ В результате секвенирования ДНК по Сэнгеру создается хроматограмма, показывающаяя приблизительный нуклеотидный состав молекулы. Для выполенения работы были взяты прямая и обратная хроматограммы ДНК (обратная хроматограмма перевернута с помощью команды Reverse программы Chromas).
Исходные хроматограммы:
L33_COI_F - прямая хроматограмма
L33_COI_R - обратная хроматограмма
◊ Начало и концы каждой хроматограммы нечитаемы из-за особенностей метода секвенирования, поэтому перед выравниванием они были удалены.
# | Удаленные нуклеотиды начала | Удаленные нуклеотиды конца |
Прямая хроматограмма (F) | 1-151 | 501-570 |
Обратная хроматограмма (R) до команды Reverse | 1-170 | 480-543 |
В целом, качество хроматограмм хорошее, средние участки очень близки к идеальным вариантам хроматограмм:
А) Есть нуклеотиды, где пики хроматограмм выпадают по высоте из общей массы, но таких нуклеотидов немного
Б) Уровень шума невысокий
При приближении к концам хроматограмм качество существенно падает, многие пики начинают сливаться, уровень шума возрастает, появляется гораздо больше проблемных нуклеотидов. Концы хроматограммы нечитаемы.
◊Исправления
1. Проблемные нуклеотиды 23 и 25 прямой хроматограммы (рис.1)
В изначальной прямой хроматограмме эти нуклеотиды не опознаны, поэтому они были исправлены на нуклеотиды t и g в соответствии с обратной хроматограммой, где пики четкие, а уровень шума низкий (рис. 2).
На прямой хроматограмме эти нуклеотиды не отображаются из-за того, что уровень шума совпал с сигналом реальныъ нуклеотидов.ССЫЛКА2
2. Проблемные нуклеотиды 44 и 49 прямой хроматограммы
В данном случае нуклеотиды появляются также из-за высокого уровня шума (широкий синий сигнал на рисунке 3). Последовательность испралена в соответствии с обратной хроматограммой.
3. Проблемные нуклеотиды 334, 336, 341, 341, 343, 350 прямой хроматограммы (рисунок 4)
- Нуклеотид 334 прямой хроматограмме обозначен как неопознанный, хотя уровень шума достаточно невелик. Значение также было проверено по обратной хроматограмме
- Нуклеотиды 336 и 341-343 были проверены по обратной хроматограмме
- Нуклеотид 350 не был опознан на обеих хроматограммах из-за высокого уровня шума, однако его вполне можно принять за тимин.
4. Проблемный нуклеотид 315 обратной хроматограммы (после команды Reverse)
Хотя уровени реального сигнала и сигнала "шума" очень близки, все же предполагается, что это не полиморфизм, поскольку уровень шума в конкретном нуклеотиде сопоставим с уровнем шума в его ближайшем окружении (рис.5)
К сожалению, ярко выраженных полиморфизмов в хроматограммах обнаружено не было.
◊ Прямая отредактированная последовательность (FASTA)
◊ Обратная отредактированная последовательность (FASTA)
◊Выравнивание needle в формате (FASTA)
◊Проект jalview ДО и
ПОСЛЕ редактирования проблемных нуклеотидов
Нечитаемая хроматограмма
◊ Хроматограмма L49_COI_F была рассмотрена в качестве нечитаемой. В данной хроматограмме по большей части виден лишь шум с некоторыми выбивающимися группами высоких пиков (рис.6).
Фрагменты, где все же немного прослеживаются сигналы, нечитаемы из-за того, что сигналы накладываются друг на друга и перекрываются с шумом (рис.7)
©Машковская Анна, 2018