Пракикум 6: Секвенирование по Сэнгеру

Рисунок 1 — Хроматограмма, общий вид

Вводные по выполнению работы

  • Файл хроматограммы: 15_F.ab1
  • Программа для анализа: UGENE
  • Обозначения: для гетерозиготных позиций использовались символы IUPAC
  • Метод анализа: «на глаз» (визуальная оценка качества сигнала)

Результаты


1. Общие параметры хроматограммы

  • Общая длина последовательности: 716 нуклеотидов
  • Качество секвенирования: хорошее

2. Трудночитаемые участки на концах

Как и ожидалось для метода Сэнгера, начальный и конечный участки имеют низкое качество:

  • Позиции 1-100: высокий фон (Рис. 2)
  • Позиции 611-716: сжатие пиков, наложения (Рис. 3)
Рисунок 2 — Начальный трудночитаемый участок (позиции 1-100)

Рисунок 3 — Конечный трудночитаемый участок (позиции 611-716)

3. Оценка уровня шума

  • Общая характеристика: Уровень шума низкий на протяжении всей хроматограммы.
  • Локальные проблемы: есть отдельные участки со сбоями (например, позиции 198-200, рис. 4)
Рисунок 4 — Пример локальной проблемы – «сбоя», позиции 198-200

Примеры разных ситуаций:

  • Минимальный шум (376-395): Четкие разделенные пики (Рис. 5)
  • Шум не мешает интерпретации (244-251): Фон присутствует, но не затрудняет чтение (Рис. 6)
  • Шум мешает интерпретации (316-322, 369-374): Скачки фона искажают сигнал (Рис. 7 и рис. 8)

Рисунок 5 — Участок с минимальным шумом
Рисунок 6 — Шум есть, но не мешает чтению
Рисунок 7 — Участки, где шум мешает интерпретации, позиции 315-324
Рисунок 8 — Участки, где шум мешает интерпретации, позиции 368-374

4. Выявленные проблемы

При визуальном анализе хроматограммы обнаружено 8 позиций (или коротких участков), в которых автоматическое определение нуклеотида ошибочно или неоднозначно. Эти случаи можно разделить на три группы: гетерозиготные полиморфизмы (чёткие двойные пики), артефакты типа «пятна краски» (локальные выбросы флуоресценции) и два нестандартных явления.

Обозначения нуклеотидов согласно стандарту IUPAC – см. таблица 1, источник: www.hgmd.cf.ac.uk/docs/nuc_lett.html


Полиморфизмы

В четырёх позициях наблюдаются два пика сравнимой высоты, что соответствует наличию двух разных нуклеотидов в исследуемом образце.

  • Позиция 176 (Рис. 9)
  • T и G → K
Рисунок 9 — Полиморфизм T/G (K) в позиции 176
  • Позиция 305 (Рис. 10)
  • T и G → K
Рисунок 10 — Полиморфизм T/G (K) в позиции 305
  • Позиция 430 (Рис. 11)
  • A и G → R
Рисунок 11 — Полиморфизм A/G (R) в позиции 430
  • Позиция 327 (Рис. 12, 13):
    Я склоняюсь к тому, что это не полиморфизм, а артефакт. В последовательности GGNGGGG на месте N чётко читается тимин, а гуаниновый пик, скорее всего, является остаточным сигналом от предыдущего гуанина, который не успел полностью угаснуть до нуля перед следующим гуанином.
Рисунок 12 — Артефакт в позиции 327, контекст GGNGGGG (приближённо)
Рисунок 13 — Артефакт в позиции 327, общий вид

Пятна краски

В двух случаях на хроматограмме наблюдаются резкие локальные выбросы сигнала, которые не являются настоящими полиморфизмами, но и не делают участок полностью нечитаемым. По форме они напоминают попадание избытка красителя («пятна краски»).

В обоих случаях артефакт не мешает интерпретации: сигналы нуклеотидов достаточно яркие и чёткие, чтобы их можно было правильно считать (повезло)

  • Позиция 124-128 (Рис. 14)
Рисунок 14 — Пятно краски в позициях 124–128
  • Позиция 197-200 (Рис. 15)
Рисунок 15 — Пятно краски в позициях 197–200

Если б мы знали, что это такое, но мы не знаем, что это такое

И ещё два места, которые я не могу однозначно отнести ни к полиморфизмам, ни к пятнам, ни к шуму. Что с ними делать — решала по контексту.

  • Позиция 266-267 (Рис. 16):
    Между хорошо выраженным пиком T (позиция 266) и ярким A (позиция 277) обнаруживается чёткий пик G. Он слишком высок и узок для обычного шума, но и на полноценный полиморфизм не похож, так как соседние пики не показывают подобной картины. Возможно, это кратковременный выброс флуоресценции, редкий технический сбой или локальное наложение сигналов. Так как, ни автоматическое определение, ни я, не смогли точно сказать, что это сигнал именно нуклеотида (автоматическое определение даже N не предлагает поставить), предлагаю посчитать это шумом и не вписывать в последовательность
    Рисунок 16 — Неоднозначный пик G между позициями 266 и 267
  • Позиция 316-320 (Рис. 17):
    Этот участок вызывает вопросы из-за внезапного изменения характера сигнала. До него хроматограмма ровная, уровень шума низкий. Начиная с позиции 316, возникают повторяющиеся пики C и G, причём форма пиков воспроизводится с небольшой задержкой – как при электрическом «эхе» или наложении сигнала. Скорее всего, это кратковременный сбой детектора, а не реальный полиморфизм (пики не независимы, а скопированы). Фрагмент не подлежит интерпретации.
Рисунок 17 — Нестабильный участок с «эхо»-сигналами в позициях 316–320

Таблица 1. Nucleotide symbols, источник: www.hgmd.cf.ac.uk/docs/nuc_lett.html
Nucleotide symbol Full Name
A Adenine
C Cytosine
G Guanine
T Thymine
U Uracil
R Guanine / Adenine (purine)
Y Cytosine / Thymine (pyrimidine)
K Guanine / Thymine
M Adenine / Cytosine
S Guanine / Cytosine
W Adenine / Thymine
B Guanine / Thymine / Cytosine
D Guanine / Adenine / Thymine
H Adenine / Cytosine / Thymine
V Guanine / Cytosine / Adenine
N Adenine / Guanine / Cytosine / Thymine

Итоги

Хроматограмма 15_F.ab1 демонстрирует высокое качество секвенирования. Выявлены характерные для метода Сэнгера проблемы на концах последовательности и несколько гетерозиготных позиций в середине. Все неоднозначности успешно разрешены с помощью символов расширенного алфавита IUPAC, что обеспечивает корректное представление генетической последовательности.


Placeholder

Практикум 3

Комплексы ДНК-белок

Тык

Placeholder

Практикум 7

Нуклеотидные банки данных

Тык

Placeholder

Практикум 8

Нуклеотидный BLAST

Тык