Анализ транскриптомов.

 Часть 1.

Подготовка чтений и их анализ.

КомандаФункция
fastqc chr3.1.fastq Информация о качества чтений.

Картинка FastQC "Per base quality":
Рисунок 1.

Число чтений21211
Длина чтений 33-51

Данная реплика имеет довольно хорошее качество, так как все столбцы находятся в зеленой зоне, и она имеет нормальную длину чтений.

 Часть 2-3.

Картирование чтений и анализ выравниваний.

КомандаФункция
hisat2-build chr3.fasta chr3 Индексация референсной последовательности.
hisat2 --no-softclip -x chr3 -U chr3.1.fastq -S chr312.samПостроение выравнивания прочтений и референса в формате .sam.
samtools view chr312.sam -b -o chr312.bamПеревод выравниваний чтений с референсом в бинарный формат .bam.
samtools sort chr312.bam -T chr3.txt -o chr312sort.bamСортировка выравниваний чтений с референсом по координате в референсе начала чтения.
samtools index chr312sort.bamИндексирование отсортированного файла.

Из 21211 чтений выравнено на геном 21055 чтений, из них 127 прочтений выравнено >1 раза. Число невыравнененных чтений - 156.
Из команды Hisat2 было убрано "--no-spliced-alignment", так как эта опция запрещает выравнивание отдельных фрагментов транскриптов при картировании. В данном случае этого делать ненужно.

 Часть 4-5.

Подсчет чтений и анализ результатов.

КомандаФункция
/P/y14/term3/block4/SNP/bedtools2/bin/bedtools bamtobed -i chr312.bam > chr312.bed Создание файла в формате .bed из файла формата .bam c координатами каждого выравненного чтения. Содержится вся информация из аннотации для более удобного анализа.
/P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -a /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed -b chr312.bed -c > peres_chr312.bedПолучение пересечения полученных координат с разметкой генов в файле формата .bed.
sort -k 6 -r peres_chr312.bed > sort.bedПолучение отсортированного файла.
Почти все прочтения легли в границы кодирующего белок гена TFRC, и только три прочтения легли в границы гена RNU7-18P, кодирующего малую ядерную РНК.
Белок, кодируемый TFRC, является мембранным белком, необходимым для доставки железа от трасферрина в клетку.

 Часть 6.

Дополнительные функции Bedtools.

КомандаФункция
/P/y14/term3/block4/SNP/bedtools2/bin/bedtools bamtofastq -i chr312.bam -fq chr312.fq Создание файла с чтениями в формате fastq. из файла с выраниванием.
/P/y14/term3/block4/SNP/bedtools2/bin/bedtools getfasta -fi chr3.fasta -bed chr312.bed > chr3124.fasta Получение файла с нуклеотидной последовательностью (.fasta) для одного из покрытых нашими чтениями генов.
/P/y14/term3/block4/SNP/bedtools2/bin/bedtools cluster -i chr312.bed > cluster.bedОбъединение чтений в кластеры. (Всего 46 кластеров)
[назад]

© Бартыш Катя