A B C
1 0.1 0.6 0.3
в анализ данных NGS
Блок 3 - Занятие 13
Анастасия Жарикова
Вспоминаем особенности пробоподготовки
Прибор
Качество РНК
Тип библиотеки (полиА, деплеция рРНК, малые РНК, …)
Ориентированность
PE/SE
Длинна чтений
Размер библиотеки
Количество реплик (биологических, технических)
Дизайн исследования (дифференциальная экспрессия, поиск новых транскриптов, анализ малых РНК, …)
снова .fastq.gz
снова проверяем качество (fastQC)
проверяем наличие адаптеров
аккуратней с триммированием (3`-bias)
дубликаты не всегда плохо
развития событий
картирование на референсный геном
картирование на референсный транскриптом
псевдовыравнивание (kallisto)
сборка транскриптома de novo
В чем принципиальное отличие картирования на референсный геном ДНК-чтений (экзом) и РНК-чтений (полиА)?
HISAT2
опять sam/bam
снова смотрим % картированных чтений
обратите внимание на поле CIGAR
Как быть с индексами генома?
Проверяем, сколько чтений попало в границы разметки
Работает с уникально-картированными чтениями
Что делать, если мало?
множественное картирование
выравнивание мимо разметки -> сборка транскриптов (+ референсный gtf - не de novo!; без референсного gtf - de novo)
один образец -> экспрессионный профиль
много образцов -> много экспрессионных профилей -> дифференциальная экспрессия как возможный вариант анализа
Построение экспрессионного профиля
Анализ дифференциальной экспрессии
Поиск новых генов и транскриптов
Исследование структуры транскриптов
Анализ дифференциального сплайсинга
Модификации РНК
Построение генных сетей
…
Если есть свой gtf -> makeTxDbFromGFF
Если есть свой bam -> AlignmentsTrack OR DataTrack
посмотрим покрытие чтениями какого-нибудь гена
Что будем делать?
samtools view -hb chr3.bam 3:48550000-48600000 > COL7A1.bam
samtools index COL7A1.bam
Тернарный график, треугольная диаграмма