Учебная страничка Васюткиной Ольги | |||||
|
|||||
Картирование на референсный геномЕсть обработанные риды генома Arabidopsis thaliana.
Задача - определить, какие из них картируются на геномы хлоропласта и митохондрии. Для картирования используется программа BWA (Burrows-Wheeler Alignment Tool).
Она основана на преобразовании Барроуза — Уилера. Чтобы проанализировать полученные выравнивания, используем программу samtools.
Она работает с данными в формате bam. Переведем полученные данные в этот формат с помощью подпрограммы view.
Опции: -S для входного файла в формате sam, -b для выходного файла в формате bam, -h для заголовка в выходном файле. Чтобы выяснить, сколько чтений откартировалось на каждую органеллу, воспользуемся подпрограммой idxstats.
Вначале нужно отсортировать данные (sort) и индексировать их (index). Результат: ENA|AP000423|AP000423.1 154478 670023 0 ENA|Y08501|Y08501.2 366924 73370 0 * 0 0 3115103 Это значит, что на хлоропласт (ENA|AP000423|AP000423.1) откартировалось 670023 рида, а на митохондрию (ENA|Y08501|Y08501.2) - 73370. Чтобы выяснить среднее покрытие для каждой из органелл, используем подпрограмму samtools depth. |
© Olga Vasyutkina, 2013-2014
Дата последнего изменения: 23.12.2014
Задавайте вопросы по электронной почте