На главную

Занятие 10. Поиск сигналов. chip-seq

Определение сайтов связывания ТФ в заданном участке хромосомы человека

Работа велась с файлом chipseq_chunk30.fastq, содержащим риды Illumina, полученные в ходе ChIP-seq эксперимента. Контроль качества прочтений был осуществлен с помощью программы fastQC. Результат работы программы представлен на рис.1 В данном случае в очистке чтений не было необходимости.


Рис. 1. Качество прочтений: выдача программы fastQC

Риды были откартированы на проиндексированный геном человека при помощи алгоритма BWA-MEM. Анализ картирования проводился при помощи samtools:
view для перевода в бинарный формат,
sort для сортировки выравнивания по координате начала рида в референсе,
index для индексирования,
idxstats для получения информации о количестве прочтений на каждой из хромосом.

Все риды откартировались, причем большая часть (7995 из 8816) на 19 хромосому. Информация о картировании чтений приведена на рис. 3.

Рис. 3. Картирования чтений по хромосомам

Поиск пиков осуществлялся при помощи программы MAKS. Результаты работы программы отображены в таблице.

Визуализация пиков проводилась в геномном браузере UCSC Genome Browser. Для того чтобы использовать файл [narrowPeaks] в качестве трэк-файла, в него были добавлены следующие строки:
track type=narrowPeak visibility=3 db=hg19 name="my_peaks" description="Peaks from chunk 30"
browser position chr19:48900000-49800000
На рис. 4 приведен соответствующий скриншот из браузера.


Рис. 4. Визуализация пиков в UCSC Genome Browser

Более подробная информация о пиках 5 и 13 приведена в таблице и на рис. 5 и рис. 6.



Рис. 5. Визуализация пиков в UCSC Genome Browser


Рис. 6. Визуализация пиков в UCSC Genome Browser