Чтение последовательностей по Сэнгеру

Ссылки на исходные файлы хроматограмм:

Прямая последовательность

Обратная последовательность

Ссылки на итоговые последовательности:

Прямая последовательность, редактированная - fasta-файл

Обратная последовательность, редактированная - fasta-файл

Краткая характеристика хроматограмм

Характеристика Прямая последовательность Обратная последовательность
Нечитаемый фрагмент с 5'-конца 1-25 1-14
Нечитаемый фрагмент с 3'-конца 705-717 686-717
Характеристика сигнала Шум низкий, не превышает 5-10% от высоты пиков. Уровень сигнала значительно ниже, чем сигналы от обратной последовательности и равномернее (если принять крупнейшие пики за 100%, то остальные пики находятся в районе 50-75%) Шум низкий, не превышает 5-10% от высоты пиков. Уровень сигнала выше, чем сигналы от прямой последовательности, менее равномерный (если принять крупнейшие пики за 100%, большинство находятся в районе 40-60%.

Ссылка на проект, с выравниванием отредактированных последовательностей

Проблемные нуклеотиды

Проблемный нуклеотид здесь один из тройки GGG. На хроматограмме можно увидеть, как вместо обычного пика наблюдается более округлый правый склон. Сравнивая с обратной последовательностью, видно, что в аналогичном месте наблюдается только два гуанина, что позволяет заключить, что один из гуанинов является лишним.

Проблемный нуклеотид отмечен здесь как N. Глядя на хроматограмму, можно предположить, что этот нуклеотид представляет из себя зашумленный сигналом гуанина аденин, что подтверждается сравнением с обратной последовательностью, где нет шумового сигнала.

Здесь проблемные нуклеотиды показаны как два N вокруг аденина. Исходя из хроматограммы, скорее всего, это зашумленные тимин и гуанин. Сверка с обратной последовательностью подтверждает данный вывод, так как значимых сигналов выше уровне шума там не наблюдается.

Нечитаемая часть хроматограммы

Здесь показана правая нечитаемая часть хроматограммы обратной последовательности. Видно наличие "пятен", то есть, резкого увеличения сигнала, размывание пиков, их неправильная форма, дублирование пиков и размывание границы между шумом и сигналом. Ясно видно, что по такой хроматограмме невозможно делать выводы.


© Котюргин Александр, 2015