Анализ транскриптомов

Процесс работы

В рамках данного практикума нас просят провести картирование чтений, полученных в результате секвенирования транскриптома, на участок хромосомы человека. Работа велась, как и в практикуме 11, по хромосоме №6. Выполненные команды, приведены в таблице 1.

Таблица 1. Использованные команды
fastqc chr6.1.fastq Проверка качества чтений программой FastQC, получение html-страницы с результатом.
hisat2 -x ../index/chr6.idx -U chr6.1.fastq -S chr6.1_align.sam --no-softclip Картирование: построение выравнивания чтений РНК и референсного участка хромосомы в формате .sam.
samtools view -b chr6.1_align.sam -o chr6.1_align.bam Перевод файла с выравниванием в бинарный формат .bam.
samtools sort chr6.1_align.bam chr6.1_align_sorted Сортировка выравнивания по координате в референсе.
samtools index chr6.1_align_sorted.bam Индексация отсортированного файла.
htseq-count -f bam chr6.1_align.bam -i gene_id -s no -m union /nfs/srv/databases/ngs/Human/rnaseq_reads/gencode.v19.chr_patch_hapl_scaff.annotation.gtf > counts.txt

Подсчёт чтений.

-f - Формат входных данных (sam/bam).

-i - Атрибут GFF, который будет использоваться в качестве идентификатора объекта (по умолчанию gene_id).

-s - Учитывается ли направление цепи, или анализируютя оба направления (yes/no/reverse).

-m - Определяет, как программа будет интерпретировать положение прочтения относительно референсных генов, какое перекрывание считывается (union/intersection-strict/intersection-nonempty).

Анализ качества чтений

Проверка качества чтений командой fastqc показала, что чтения достаточно качественные, чтобы избежать триммирования - рис.1 (отчёт).

качество чтений
Рис. 1. Качество чтений.

Картирование чтений

Результат команды hisat2:

54019 reads; of these:
  54019 (100.00%) were unpaired; of these:
    9239 (17.10%) aligned 0 times
    44780 (82.90%) aligned exactly 1 time
    0 (0.00%) aligned >1 times
82.90% overall alignment rate

Было картировано 44780 чтений - 82.90%.

Анализ подсчёта чтений

В результате работы программы htseq-count был получен файл с информацией о подсчёте:

ENSG00000156508.13	44605
__no_feature	175
__ambiguous	0
__too_low_aQual	0
__not_aligned	9239
__alignment_not_unique	0

Как можно заметить, большинство чтений откартировались на ген ENSG00000156508.13, другие чтения легли непонятно на что, а оставшаяся часть вообще не откартировалась.

Данный ген кодирует изоформу Альфа-субъединицы комплекса фактора удлинения-1, которая отвечает за ферментативную доставку аминокислотных тРНК к рибосоме. Эта изоформа (альфа 1) экспрессируется в головном мозге, плаценте, легких, печени, почках и поджелудочной железе, а другая изоформа (альфа 2) экспрессируется в головном мозге, сердце и скелетных мышцах. Эта изоформа идентифицирована как аутоантиген у 66% пациентов с синдромом Фелти. Было обнаружено, что этот ген имеет множественные копии на многих хромосомах, некоторые из которых, если не все, представляют различные псевдогены [1].

[1] - NCBI

Назад

Главная страница