Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2018

Практикум 12

Задача: картировать чтения, полученные в результате секвенирования транскриптома (человек, версия сборки генома hg19)

Дано:

1. Чтения, картирующиеся на участок хромосомы человека (получены путем секвенирования РНК).

Файлы с одноконцевыми чтениями в формате fastq лежат на kodomo в директории /nfs/srv/databases/ngs/Human/rnaseq_reads.

Распределение файлов по студентам см. в Ведомости.

Берем ту же хромосому, что и была при выполнении заданий практикума 11 (!)

Для каждой хромосомы есть 2 (!) файла fastq - это 2 биологические реплики. В рамках обязательного задания достаточно работать с одной (любой) репликой.

2. Разметка человеческого генома по версии Gencode19 для сборки hg19. Разметка в формате .gtf лежит на kodomo в директории /nfs/srv/databases/ngs/Human/rnaseq_reads (gff и gtf формат - это почти одно и то же)

В отчёт включите

* Табличку со всеми выполненными командами:

* Отчеты по частям 1-5

1. Анализ качества чтений

см. Практикум 11

2. Картирование чтений

см. Практикум 11

Подсказка: при запуске Hisat2 нужно УБРАТЬ один из параметров. Объясните какой параметр и почему Вы убрали.

Используйте те же индексные файлы, что и при картировании экзомного секвенирования.

3. Анализ выравнивания

см. Практикум 11

4. Подсчет чтений

Вам нужно воспользоваться программой htseq-count

Используйте опции -f, -s, -i, -m

Объясните значение каждой из опций

5. Анализ результатов

Прокомментируйте выдачу скрипта count.py

Все ли чтения легли в границы генов?

Если нет, то куда еще легли чтения и почему?

Какой ген(ы) Вам достались? Опишите его(их) функции.

Дополнительные задания

* Проделайте все задания для второй биологической реплики и сравните количество чтений, покрывающих Ваш ген(ы). Прокомментируйте.

* Посмотрите на выравнивание в IGV. Чем картинка отличается от геномных чтений?

* Запустите Htseq-count с другим способом подсчета чтений. Есть ли отличия для Вашего гена(ов)?