Учебная страница курса биоинформатики,
год поступления 2017
Практикум 12
Задача: картировать чтения, полученные в результате секвенирования транскриптома (человек, версия сборки генома hg19)
Дано:
1. Чтения, картирующиеся на участок хромосомы человека (получены путем секвенирования РНК).
Файлы с одноконцевыми чтениями в формате fastq лежат на kodomo в директории /P/y14/term3/block4/SNP/rnaseq_reads.
Распределение файлов по студентам см. в Ведомости.
Берем ту же хромосому, что и была при выполнении заданий практикума 11
Для каждой хромосомы есть 2 файла fastq - это 2 биологические реплики. В рамках обязательного задания достаточно работать с одной (любой) репликой.
2. Разметка человеческого генома по версии Gencode19 для сборки hg19. Разметка в формате .gtf лежит на kodomo в директории /P/y14/term3/block4/SNP/rnaseq_reads (gff и gtf формат - это почти одно и то же)
В отчёт включите
* Табличку со всеми выполненными командами:
- команда (со всеми параметрами)
- что делает
* Отчеты по частям 1-5
1. Анализ качества чтений
см. Практикум 11
2. Картирование чтений
см. Практикум 11
Подсказка: при запуске Hisat2 нужно УБРАТЬ один из параметров. Объясните какой параметр и почему Вы убрали.
Используйте те же индексные файлы, что и при картировании экзомного секвенирования.
3. Анализ выравнивания
см. Практикум 11
4. Подсчет чтений
Вам нужно воспользоваться программой htseq-count
Используйте опции -f, -s, -i, -m
Объясните значение каждой из опций
5. Анализ результатов
Прокомментируйте выдачу скрипта count.py
Все ли чтения легли в границы генов?
Если нет, то куда еще легли чтения и почему?
Какой ген(ы) Вам достались? Опишите его(их) функции.
Дополнительные задания
* Проделайте все задания для второй биологической реплики и сравните количество чтений, покрывающих Ваш ген(ы). Прокомментируйте.
* Посмотрите на выравнивание в IGV. Чем картинка отличается от геномных чтений?
* Запустите Htseq-count с другим способом подсчета чтений. Есть ли отличия для Вашего гена(ов)?