Выравнивание хроматограмм

Прямая последовательность в формате fasta(отредактированная)
Обратная последовательность в формате fasta(отредактированная)
Прямая последовательность(исходная)
Обратная последовательность(исходная)
JalView-проект с выравниванием прямого и обратного прочтений

Оценка качества хроматограммы
В хроматограмме прямого прочтения нечитаемыми является первый 31 нуклеотид, конец последовательности является читаемым. В хроматограмме обратного прочтения(уже с использованием reverse+complement) нечитаемыми ялвяются нуклеотиды 357-380(24 нуклеотида), начало является читаемым.
В обратной хроматограмме почти отсутствует шум (его высота несравнима с высотой самих пиков), в прямой хроматограмме уровень шума выше, иногда высота шумовых пиков достигает половины высоты пиков нуклеотидов.
В прямой хроматограмме уровень шума в первой половине последовательности выше и чаще бывает сравним с высотой пиков самой последовательности, чем во второй половине хроматограммы.
Решения для некоторых нуклеотидов

Ниже представлены обоснования некоторых решений для проблемных нуклеотидов. Сверху изображена прямая хроматограмма, снизу - обратное прочтение.


Исходя из обратной хроматограммы(снизу) мы можем списать появление пика G совместно с пиком C на повышенный уровень шума и на месте N (9-й нуклеотид на прямой хроматограмме сверху) должен стоять C. Аналогично с 12-м нуклеотидом, пик G появляется вместе с A из-за повышенного уровня шум (так как на обратной хроматограмме присутствует только пик A).


Пик G появляется на хроматограмме совместно с пиком C из-за повышенного уровня шума. На обратной хроматограмме пик G отсутствует, поэтому правильный ответ для 56-го нуклеотида - C.


Пик G присутствует совместно с пиком A на обоих хроматограммах, поэтому это можно считать полиморфизмом, и правильный ответ для 102-го нуклеотида - r.


Пик T совместно с пиком C присутствует на обоих хроматограммах, поэтому это можно считать полиморфизмом, и правильный ответ для 255 нуклеотида - y.


Нечитаемая хроматограмма

Невозможно различить шум и непосредственный сигнал, перекрывание пиков.


©Кондратенко Наталья, 2017