Введение

в анализ данных NGS

Блок 3 - Занятие 11

Анастасия Жарикова

  • Что такое секвенирование?

Определение последовательности некоторого нерегулярного биологического гетерополимера – белка или нуклеиновой кислоты

  • Что такое NGS?

Next-generation sequencing

Секвенирование следующего (нового) поколения



Следующего относительно чего?

  • Что можно секвенировать?
  • Белки (не будем обсуждать)

  • Нуклеиновые кислоты (ДНК, РНК)

  • Как можно секвенировать нуклеиновые кислоты?
  • Секвенирование по Сэнгеру

  • Массовое параллельное секвенирование (Illumina)

  • Одномолекулярное секвенирование

Sanger

Метод “терминаторов” - ~ 1000 п.н. - “Золотой” стандарт

Секвенирование: поколения

Секвенаторы: особенности

Sanger Illumina MiSeq Illumina NextSeq Illumina HiSeq Illumina NovaSeq Pacific Biosciences Oxford Nanopore
Throughput range per run (Gb) c. 0.0005 10–15 10–120 1000–1800 2000–6000 0.5-10 0.1-1
Read length Up to 1 kb 300 150 150 250 up to 60 kb up to 100 kb
Read type SR SR, PE SR, PE SR, PE SR, PE SR SR
Error rate (%) 0.001–1 0.8 0.8 0.2 0.2-0.8 13 5-40
Error type Substitutions Substitutions Substitutions Substitutions Substitutions Indels Indels, deletions
Advantages Read accuracy and length Read length Throughput Throughput, low error rate High throughput Speed, read length Read length, portability

Разнообразие секвенаторов

ref

NGS: основные стадии

Illumina

SE vs PE

Одноконцевые чтения - single-end reads - SE

Парноконцевые чтения - paired-end reads - PE

Illumina vs BGI/MGI

Illumina: “+” и “-”

  • “+” - одновременно идет сиквенс большого количества разных фрагментов

  • “-” - прочтения длиной 75 - 150 нукл

Проблемы

в процессе пробоподготовки

  • Димеры адаптеров

  • Слишком короткий фрагмент ДНК

  • Контаминация

Историческая справка

  • Расшифровка структуры ДНК (1953)

    • Фрэнсис Крик, Джеймс Уотсон, Морис Уилкинс, Нобелевская премия 1962
  • Секвенирование по Сэнгеру (1975 – 1977)

    • Фредерик Сэнгер, Нобелевская премия 1980 (вторая!) (с Уолтером Гильбертом и Полем Бергом)
  • Полимеразная цепная реакция (1985 – 1986)

    • Кэрри Муллис, Нобелевская премия 1993 (совместно с Майклом Смитом)
  • NGS — совокупность методов (454, Illumina, Oxford Nanopore, PacBio и проч.) (2005 – наст. вр.)

NGS: применение

Ресеквенирование

Как именно можно секвенировать ДНК:

  • полный геном

  • экзом (кодирующая часть генома)

  • таргетное ресеквенирование

  • секвенирование определенных локусов ДНК, полученных в результате специфической пробоподготовки (ChIP-seq, Hi-C, ATAC-seq, …)

!!! Выбор зависит от бюджета и целей исследования!!!

NGS: примеры

Экзомное ресеквенирование

“Плюсы”

  • Небольшой объем кодирующих данных - ниже цена

  • Кодирующие последовательности лучше изучены

  • Большое число болезнетворных мутаций находится в кодирующей последовательности

“Минусы”

  • Нет информации о некодирующих участках

  • Неравномерность покрытия экзонов

Эволюция

Доместикация риса

Филогения

Исследование спейсерных последовательностей рРНК

Зачем?

Спейсерные последовательности наиболее вариабельны с точки зрения эволюционной консервативности.

Секвенирование и анализ транскрибируемых спейсеров используется для изучения видового разнообразия и классификации близкородственных организмов.

Популяционные и клинические исследования

  • 1000 genomes, gnomAD: частоты вариантов в популяциях

  • GWAS: поиск полиморфизмов, ассоциированных с болезнями:

    • моногенные (муковисцидоз, ген CFTR)

    • полигенные (ишемическая болезнь сердца, шизофрения, …)

  • Фармакогенетика и индивидуальные особенности

    • варфарин

    • исследование генов из системы свертывания крови

Конец!