Учебный сайт Корляковой Марии

Секвенирование по Сэнгеру

1.Сборка последовательности по прочтениям

Ссылка на исходные файлы:

forward-read reverse-read

Результат:

консенсусная последовательность

Характеристика хроматограммы:

Таблица 1. Границы нечитаемых участков.
Участок в начале Участок в конце
Прямая цепочка проблем нет 568-669 нуклеотид
Обратная цепочка 1-177 нуклеотид проблем нет

*При автоматическом пороге в 30 нуклеотидов

Визуальная оценка неравномерности сигнала: для прямого и обратного прочтений характерны четкие, соотносимые по высоте пики в середине и неравномерные, сильно разбросанные по высоте пики в начале и конце обоих последовательностей.

Визуальная оценка неравномерности шума: в начале и конце прямого и обратного прочтений пики имеют разнообразную, "неправильную", форму, часто пересекаются или сливаются, в середине последовательности пики а хроматограмме хорошо различимы, сигналы небольшого фонового загрязнения находятся на очень низком уровне.

В целом можно сказать, что оба прочтения достаточно хорошего качества, а вырезанные проблемные участки каждого прочтения можно восстановить по другой цепи.

Выравнивания:

Выравнивание последовательностей прямой и обратной цепей с консенсусной последовательностью:

fasta-файл

Выравнивание отредактированных последовательностей прямой и обратной цепей с референсной последовательнстью:

fasta-файл

После выравнивания прямого и обратного прочтения на прямое прочтение и редактирования всех нечитаемых участков вручную, с помощью blastn NCBI и полученной консенсусной последовательности была найдена последовательность генов идентичная консенсусной — Scoloplos acutissimus voucher W.44175.001 18S ribosomal RNA gene.

Исправление полиморфизмов:

Полиморфизмы 338, 340 прямого прочтения: довольно четко видно, что 338 позиция — С, а 340 позиция — Т, это также подтверждается по комплементарности обратного прочтения
Полиморфизм 359 прямого прочтения: восстанавливаем по комплементарности обратного прочтения, 359 нуклеотид — Т
Полиморфизмы 476 прямого прочтения и 477 обратного прочтения: 476 нуклеотид — Т, 477 нуклеотид восстанавливаем по комплементарности прямого прочтения — G

2.Пример нечитаемой хроматограммы

В качестве примера был взят файл L46_COI_F_A07_WSBS-Seq-07-10-16.ab1 из директории /bad. Хроматограмма этого файла очень короткая, поэтому была рассмотрена целиком. На хроматограмме отчетливо видно, особенно в начале, сильное загрязнение сигналом G нуклеотида (загрязнение красителем), также ближе к концу видно практически отсутствие сигналов, это может быть связано с загрязнениями образца ингибиторами, либо с нехваткой продуктов ПЦР.