Процесс работы
В рамках данного практикума нас просят провести картирование чтений, полученных в результате секвенирования транскриптома, на участок хромосомы человека. Работа велась, как и в практикуме 11, по хромосоме №6. Выполненные команды, приведены в таблице 1.
fastqc chr6.1.fastq | Проверка качества чтений программой FastQC, получение html-страницы с результатом. |
hisat2 -x ../index/chr6.idx -U chr6.1.fastq -S chr6.1_align.sam --no-softclip | Картирование: построение выравнивания чтений РНК и референсного участка хромосомы в формате .sam. |
samtools view -b chr6.1_align.sam -o chr6.1_align.bam | Перевод файла с выравниванием в бинарный формат .bam. |
samtools sort chr6.1_align.bam chr6.1_align_sorted | Сортировка выравнивания по координате в референсе. |
samtools index chr6.1_align_sorted.bam | Индексация отсортированного файла. |
htseq-count -f bam chr6.1_align.bam -i gene_id -s no -m union /nfs/srv/databases/ngs/Human/rnaseq_reads/gencode.v19.chr_patch_hapl_scaff.annotation.gtf > counts.txt | Подсчёт чтений. -f - Формат входных данных (sam/bam). -i - Атрибут GFF, который будет использоваться в качестве идентификатора объекта (по умолчанию gene_id). -s - Учитывается ли направление цепи, или анализируютя оба направления (yes/no/reverse). -m - Определяет, как программа будет интерпретировать положение прочтения относительно референсных генов, какое перекрывание считывается (union/intersection-strict/intersection-nonempty). |
Анализ качества чтений
Проверка качества чтений командой fastqc показала, что чтения достаточно качественные, чтобы избежать триммирования - рис.1 (отчёт).
![качество чтений](чтения.png)
Картирование чтений
Результат команды hisat2:
54019 reads; of these: 54019 (100.00%) were unpaired; of these: 9239 (17.10%) aligned 0 times 44780 (82.90%) aligned exactly 1 time 0 (0.00%) aligned >1 times 82.90% overall alignment rate
Было картировано 44780 чтений - 82.90%.
Анализ подсчёта чтений
В результате работы программы htseq-count был получен файл с информацией о подсчёте:
ENSG00000156508.13 44605 __no_feature 175 __ambiguous 0 __too_low_aQual 0 __not_aligned 9239 __alignment_not_unique 0
Как можно заметить, большинство чтений откартировались на ген ENSG00000156508.13, другие чтения легли непонятно на что, а оставшаяся часть вообще не откартировалась.
Данный ген кодирует изоформу Альфа-субъединицы комплекса фактора удлинения-1, которая отвечает за ферментативную доставку аминокислотных тРНК к рибосоме. Эта изоформа (альфа 1) экспрессируется в головном мозге, плаценте, легких, печени, почках и поджелудочной железе, а другая изоформа (альфа 2) экспрессируется в головном мозге, сердце и скелетных мышцах. Эта изоформа идентифицирована как аутоантиген у 66% пациентов с синдромом Фелти. Было обнаружено, что этот ген имеет множественные копии на многих хромосомах, некоторые из которых, если не все, представляют различные псевдогены [1].
[1] - NCBI