Семестры
Сайт ФББ МГУ
Kodomo Wiki
NCBI

RanHummer personal web-site


Чтение последовательностей по Сэнгеру


Задание 1. Получение последовательности фрагмента ДНК.

В данном задании было необходимо проанализировать хроматограммы из капиллярного секвенатора по Сэнгеру и на основе этого отредактировать последовательности, сгенерированные программой.

Капиллярный секвенатор по Сэнгеру выдает файлы с хроматограммой и последовательностью в формате .ab1. В моем случае анализировались результаты секвенирования ДНК, представленные в виде файлов с прямой (F в названии файла - 'forward chain') и обратной (R - 'reverse chain') цепями.

Для просмотра и редактирования результатов секвенирования использовалась программа ChromasPro 1.7.6

Результатом выполнения задания являются:
  • Выравнивание прямой и комплементарной к обратной последовательности с отмеченными измененными нуклеотидами в проекте JalView.
  • Файл в формате fasta с "чистой" прочтенной последовательностью, то есть последовательностью, в которой принято решение о нахождении определенного нуклеотида в каждой позиции.

Первый читаемый нуклеотид в прямой последовательности (14) соответствует 52 нуклеотиду обратной цепи, а последний читаемый нуклеотид обратной цепи (673) соответствует 635 нуклеотиду прямой.

  • 5' нечитаемый участок (прямая): 1-13
  • 3' нечитаемый участок (прямая): 679-691
  • 5' нечитаемый участок (компплементарная к обратной): нуклеотиды не представлены в прямой цепи
  • 3' нечитаемый участок (компплементарная к обратной): 674-696

В среднем, шум в 5-8 раз менее интенсивен, чем сигнал. Сила сигнала и шума довольно равномерна. Пики у нуклеотидов разные, могут различаться не более, чем в 5 раз. В целом, качество хроматограмм хорошее (возможно, это связано с не очень большой длиной).

Проблемные места

На рисунках 1-5 сверху расположены окна прямой последовательности, а снизу - обратной. Проблемные нуклеотиды на рисунках 1-4 выделены синим в окне редактирования кодонов.

Рис. 1. Сильный нуклеотид (C или G) в прямой последовательности уточняется как C в комплементарной.

Рис. 2. На обоих цепях нуклеотид не определен, однако наблюдается заметный пик гуанина, скрытый общим окружающим фоном цитозина.

Рис. 3. Наблюдается не до конца разделенный пик тимина на обоих хроматограммах, однако ясно видно, что это два соседних нуклеотида - тимина.

Рис. 4. Пик гуанина хорошо скрыт окружающим фоном невесть откуда взявшегося цитозина, однако если убрать шум, все становится ясно.

Рис. 5. На представленном промежутке 112-141 нет ни одного подозрительного участка. Все нуклеотиды определяются легко.

Задание 2. Пример не читаемой хроматограммы.

Файл с очень плохой хроматограммой.

Рис. 6. Пример нечитаемой хроматограммы. Большой уровень шума в начале, глухо в середине и три жутких скачка в конце.


© Поляков Игорь aka RanHummer