Учебный сайт Якушева Александра


Практикум 6. Секвенирование по Сэнгеру

Консенсусная последовательность
Выравнивание
Хроматограмма прямой
Хроматограмма обратной

Вся работа с хроматограммами была проведена в программе Chromas

Forward

В целом хроматограмма имеет высокий уровень шума. В начале есть участок из 15 нуклеотидов с широкими пиками, что заходят друг на друга. Его решено было оттримить. Затем примерно до 80 основания идет участок с приемлимым, но довольно высоким уровнем шума. От 80 и до 450 нуклеотида идет фрагмент хорошего качества, с постепенным ростом шума и начиная с 450 количество проблемных нуклеотидов резко поднимается. На 550 нуклеотиде заканчивается приемлимая по качеству область. Дальнейший кусок был удален.

Reverse

Reverse-хроматограмма по уровню шума уже гораздо лучше. Для нее приемлимым является автоматический вариант триммеровки. Уровень шума меняется аналогично с прямым прочтением, но к концу ухудшение не столь заметно. Затем из последовательности была получена реверс-комплементарная.

Проблемы

Далее на картинках первая хроматограмма - прямая цепь, вторая - реверс-комплементарная обратная.
Pic1F
Наложение двух пиков. При этом видно что на обратной цепи в этом месте явный сигнал A. Также пик G со смещением. Решено поставить G.

Pic2F
Программа опознала данное наложение пиков как проблему. По мне тут явный пик C, вторая цепь подтверждает.

Pic3FR
Тут целая россыпь проблем, но к счастью они не дублируются на обеих цепях сразу. Первая N на прямой цепи однозначно определяется как G на обратной, вторая N также определяется по обратной цепи без проблем(как буква T, да еще и с большим пиком). Первый проблемный нуклеотид обратной цепи определяется как C по прямой. Второй - как G. В пользу таких решений говорит также то, что шум на другой цепи имеет также другой характер(то есть например если на обратной цепи есть выбор между C и A, то на прямой - между C и G).

Pic4R
На обратной цепи имеет место пик C между двумя T. Мало того что он не попадае в период в данном месте, так и на прямой цепи в этом месте есть сильные пики T и близкий по шуму пик C, поэтому его решено было оставить.

Дальнейшая обработка

После ручного исправления всех ошибок, последовательности были экспортированы в виде fasta-файлов и загружены в Jalview. В ней же они были выравнены с помощью встроенной программы Muscle. Затем оттуда же была извлечена консенсусная последовательность. Примечательно что обратная последовательность получилась длиннее прямой. На концах ее есть участки которые пришлось редактировать и проверять вручную по ней же самой. Реззультаты работы приведены в начале страницы.

Плохая хроматограмма

Bad chromatography
Плохой участок хроматограммы был взят из файла L49_COI_R_F06_WSBS-Seq-07-10-16.ab1. Видно огромное количество перекрывающихся пиков, пятна краски. Похоже что в препарате несколько разных ДНК.