Пракикум 6: Секвенирование по Сэнгеру
Вводные по выполнению работы
- Файл хроматограммы: 15_F.ab1
- Программа для анализа: UGENE
- Обозначения: для гетерозиготных позиций использовались символы IUPAC
- Метод анализа: «на глаз» (визуальная оценка качества сигнала)
Результаты
1. Общие параметры хроматограммы
- Общая длина последовательности: 716 нуклеотидов
- Качество секвенирования: хорошее
2. Трудночитаемые участки на концах
Как и ожидалось для метода Сэнгера, начальный и конечный участки имеют низкое качество:
- Позиции 1-100: высокий фон (Рис. 2)
- Позиции 611-716: сжатие пиков, наложения (Рис. 3)
3. Оценка уровня шума
- Общая характеристика: Уровень шума низкий на протяжении всей хроматограммы.
- Локальные проблемы: есть отдельные участки со сбоями (например, позиции 198-200, рис. 4)
Примеры разных ситуаций:
- Минимальный шум (376-395): Четкие разделенные пики (Рис. 5)
- Шум не мешает интерпретации (244-251): Фон присутствует, но не затрудняет чтение (Рис. 6)
- Шум мешает интерпретации (316-322, 369-374): Скачки фона искажают сигнал (Рис. 7 и рис. 8)
4. Выявленные проблемы
При визуальном анализе хроматограммы обнаружено 8 позиций (или коротких участков), в которых автоматическое определение нуклеотида ошибочно или неоднозначно. Эти случаи можно разделить на три группы: гетерозиготные полиморфизмы (чёткие двойные пики), артефакты типа «пятна краски» (локальные выбросы флуоресценции) и два нестандартных явления.
Обозначения нуклеотидов согласно стандарту IUPAC – см. таблица 1, источник: www.hgmd.cf.ac.uk/docs/nuc_lett.html
Полиморфизмы
В четырёх позициях наблюдаются два пика сравнимой высоты, что соответствует наличию двух разных нуклеотидов в исследуемом образце.
- Позиция 176 (Рис. 9)
- T и G → K
- Позиция 305 (Рис. 10)
- T и G → K
- Позиция 430 (Рис. 11)
- A и G → R
- Позиция 327 (Рис. 12, 13):
Я склоняюсь к тому, что это не полиморфизм, а артефакт. В последовательности GGNGGGG на месте N чётко читается тимин, а гуаниновый пик, скорее всего, является остаточным сигналом от предыдущего гуанина, который не успел полностью угаснуть до нуля перед следующим гуанином.
Пятна краски
В двух случаях на хроматограмме наблюдаются резкие локальные выбросы сигнала, которые не являются настоящими полиморфизмами, но и не делают участок полностью нечитаемым. По форме они напоминают попадание избытка красителя («пятна краски»).
В обоих случаях артефакт не мешает интерпретации: сигналы нуклеотидов достаточно яркие и чёткие, чтобы их можно было правильно считать (повезло)
- Позиция 124-128 (Рис. 14)
- Позиция 197-200 (Рис. 15)
Если б мы знали, что это такое, но мы не знаем, что это такое
И ещё два места, которые я не могу однозначно отнести ни к полиморфизмам, ни к пятнам, ни к шуму. Что с ними делать — решала по контексту.
- Позиция 266-267 (Рис. 16):
Между хорошо выраженным пиком T (позиция 266) и ярким A (позиция 277) обнаруживается чёткий пик G. Он слишком высок и узок для обычного шума, но и на полноценный полиморфизм не похож, так как соседние пики не показывают подобной картины. Возможно, это кратковременный выброс флуоресценции, редкий технический сбой или локальное наложение сигналов. Так как, ни автоматическое определение, ни я, не смогли точно сказать, что это сигнал именно нуклеотида (автоматическое определение даже N не предлагает поставить), предлагаю посчитать это шумом и не вписывать в последовательность
- Позиция 316-320 (Рис. 17):
Этот участок вызывает вопросы из-за внезапного изменения характера сигнала. До него хроматограмма ровная, уровень шума низкий. Начиная с позиции 316, возникают повторяющиеся пики C и G, причём форма пиков воспроизводится с небольшой задержкой – как при электрическом «эхе» или наложении сигнала. Скорее всего, это кратковременный сбой детектора, а не реальный полиморфизм (пики не независимы, а скопированы). Фрагмент не подлежит интерпретации.
| Nucleotide symbol | Full Name |
|---|---|
| A | Adenine |
| C | Cytosine |
| G | Guanine |
| T | Thymine |
| U | Uracil |
| R | Guanine / Adenine (purine) |
| Y | Cytosine / Thymine (pyrimidine) |
| K | Guanine / Thymine |
| M | Adenine / Cytosine |
| S | Guanine / Cytosine |
| W | Adenine / Thymine |
| B | Guanine / Thymine / Cytosine |
| D | Guanine / Adenine / Thymine |
| H | Adenine / Cytosine / Thymine |
| V | Guanine / Cytosine / Adenine |
| N | Adenine / Guanine / Cytosine / Thymine |
Итоги
Хроматограмма 15_F.ab1 демонстрирует высокое качество секвенирования. Выявлены характерные для метода Сэнгера проблемы на концах последовательности и несколько гетерозиготных позиций в середине. Все неоднозначности успешно разрешены с помощью символов расширенного алфавита IUPAC, что обеспечивает корректное представление генетической последовательности.