Учебный сайт Григория Сафронова

Практикум №13. Ресеквенирование и поиск полиморфизмов у человека.

Ресеквенирование. Поиск полиморфизмов у человека.

Часть 1. Подготовка чтения.

Для задания была взята 16-ая хромосома.
Для начала при помощи команды fastqc chr16.fastq был создан архив с данными о прочтении.
Также был создан html-файл, в котором содержится отчет о проделанной программой работе.

Рис.1 Качество нуклеотидов в чтениях до очистки. Число чтений 3965.


Далее требовалось провести очистку чтений от участков с плохим качеством.
Для этого использовались следующие команды:

К полученному файлу была применена команда fastqc trim3.fastq: результат

Рис.2 Качество нуклеотидов после очистки. Число чтений 3796

Часть 2. Картирование чтений.

Очищенные чтения были картирован с помощью программы BWA. Сначала рeференсная последовательность была проиндексирована с помощью команды bwa index:

Рис.3. Результат bwa index.


Затем было произведено выравнивание референса с прочтениями:
bwa mem chr16.fasta trim3.fastq > align.sam. Полученный файл в формате sam: align.sam


Проанализируем полученное выравнивание:

Рисю4 Число картированных ридов выделено синим, некартированных красным.

Часть 3. Анализ SNP.

Для поиска SNP и инделей использовались следующие команды:

Всего было найдено 63 snp и 2 инделя. Из snp.vcf выбраны следующие полиморфизмы:

©Сафронов Григорий