Секвенирование по Сэнгеру


1.Получение последовательности ДНК на основании данных, полученных из капиллярного секвенатора

Ссылки на исходные файлы: forward-read reverse-read

Ссылка на получившуюся консенсусной последовательностью : Консенсусная последовательность


Характеристика хроматограммы:


Таблица 1.Границы нечитаемых участков

Участок в начале Участок в конце
Прямая цепьпроблем нет630-722 нуклеотид
Обратная цепь1-70 нуклеотидпроблем нет

Визуальная оценка неравномерности сигнала: для прямого и обратного прочтения характерны сильно разбросанные и неравномерные пики в начале и чёткие, соотносимые по высоте, пики в середине обоих последовательностей.


Визуальная оценка неравномерности шума: в середине последовательности пики в хроматограмме очень хорошо различимы, сигналы фонового загрязнения находятся на очень низком уровне. В начале и конце прямого и обратного прочтений пики имеют разнообразную форму, часто пересекаются или сливаются.


Таким образом, можно сделать вывод, что оба прочтения хорошего качества, проблемные участки можно востановить по другой цепи.


Выранивания:

Выравнивание последовательностей прямой и обратной цепей с консенсусной последовательностью: fasta-файл. Данное выравнивание было получено в программе Ugene с помощью CrustalW.

С помощью консенсусной последовательности и нуклеотидного Blast NCBI был найден огранизм с последовательностью генов идентичной консенсусной. Организм - Empididae sp. BOLD:ACG8766 voucher MDFRC_DI0012 cytochrome oxidase subunit 1 (COI) gene, partial cds; mitochondrial.

Решения по проблемным нуклеотидам:

Рис.1

Очевидно, что 109 позиция - Т. Это также подтверждается по комплементарности. Появление вторых пиков и перекрывание нуклеотида T нуклеотидом C.

Рис.2

Видно, что 159 позиция - Т. Это также подтверждается по комплементарности. Причной полиморфизма может служить разное расстояние между сигналами, вследствие чего пики могут растягиваться, перекрываться, накладваться.

Рис.3

Однозначно видно, что 540 позиция - G. В хроматограмме в данном месте наблюдаются два пика, это может быть вызвано гетерозиготностью, соматической мутацией, несколько разных образцов ДНК, несколько генов в разных локусах, ошибками во время ПЦР.

Рис.1

Однозначно видно, что 625 позиция - T. Причной полиморфизма может служить разное расстояние между сигналами, вследствие чего пики могут растягиваться, перекрываться, накладваться.

2.Пример нечитаемой хроматограммы

Для примера нечитаемой хроматограммы был взят файл из директории bad.

Проблема -пятно краски, которая может быть вызвана в связи с ошибками в течение фореза.