Секвенирование по Сэнгеру
На данной странице представлен практикум по созданию и анализу файлов с последовательностями ДНК, полученных на основании работы с хроматограммами из капиллярного секвенатора.
1) Получение последовательностей ДНК на основании данных, полученных из капиллярного секвенатора. Отчёт о проблемах при чтении хроматограмм
Для анализа качества хроматорграмм, полученных капиллярным секвенатором, и создания консенсусной последовательности, были загружены файлы прямого и обратного прочтений.
Параметры хроматограммы:
Параметры прямой хроматограммы (32_F.ab1):
Параметры обратной хроматограммы (32_R.ab1):
Сборка консенсуса:
Для создания первичного консенсуса был использован инструмент выравнивания прочтений на референсную последовательность в программе Ugene. В качестве референса была взята одна из последовательностей (32_F.ab1),
относительно которой были выровнены изучаемые прочтения. Полученный консенсус считаю первичным, он был выгружен и использован в качестве референсной последовательности в следующем выравнивании с теми же ридами. Полученный контиг (без корректировки) можно загрузить в формате fasta по
ссылке, а также увидеть на рисунке 1; консенсус данного выравнивания считаю вторичным, его можно загрузить по ссылке.
Общая длина выравнивания: 409 нуклеотидов; длина перекрывающегося участка: 300 нуклеотидов. При создании контига Ugene автоматически обрезает нечитаемые концы:
Несмотря на то, что автоматическое определение нечитаемых концевых участков прочтений более сторго, т.е. обрезает большие фрагменты, в сравнении с визуальной оценкой, различия у этих 2 методов в данном случае суммарно меньше 10 нуклеотидов, что не является критичным для аннотации ридов.
Далее производилась корректировка аннотации хроматограммы и создание более точного консенсуса с учетом знания прямого и обратных прочтений. Некоторые проблемные места описаны в следующем пункте данного упражнения. Итоговый консенсус: ссылка; проект в Ugene: ссылка.
Проблемные места хроматограммы:
Кроме вышеперечисленных, были отрецензированы все проблемные нуклеотды в данном выравнивании. С результатами составления консенсуса можно ознакомиться:
2) Нечитаемые фрагменты хроматограммы:
Участки хроматограмм могут быть нечитаемыми по разным причинам, две из которых будут разобраны в данном упражнении:
В данном случае приведен участок с начала хроматограммы, где помимо изучаемого образца фиксируется свечение отдельных нуклеотидов, флуорофоров и других неспецифичных коротких последовательностей, которые сильно затрудняют расшифровку хроматограммы.
На этой хроматограмме видно характер распределения пиков, когда в изучаемой последовательности происходит инсерция-делеция. Этот участок находится посередине хроматограммы, и можно увидеть момент, когда начинается несовпадение пиков. В данном случае индель величиной 1 нуклеотид.