Сборка de novo

Задание 1. Был взят файл из предыдущего практикума, прошедний очистку.
Команда Что делает
velveth vel 31 -fastq trim3.fastq выделяет k-меры длиной 31 из ридов
velvetg vel собирает контиги на основе k-меров


Рис1. Результат работы velvet.


Задание 2.
Команда Что делает
makeblastdb -dbtype nucl -in chr8.fasta -out chr8 создает базу данных на основе 8ой хромосомы
blastn -db chr8 -query vel/contigs.fa -outfmt 6 -out bl.out контиги бластуются против хромосомы

Полученный файл bl.out был переведен формат .txt, а затем импортирован в эксель-таблицу, в которой при помощи функции СЧЁТЕСЛИ было подсчитано, сколько раз тот или иной контиг картирован на хромосому. Оказалось, что контигов, откартированных ровно один раз, 181 шт.
  • Контиг 233 откартирован 7 раз;
  • Контиг 62 - 38 раз;
  • Контиг 59 - 6180 раз.
  • Контиги, картированные единожды, вынесены в Лист 2 таблицы. Были подсчитаны длины разрывов между соседями. Эта величина может принимать отрицательные значения, если контиги перекрываются. Встречаются разрывы в несколько тысяч баз, возможно, они соответствуют интронам. Однако был замечен разрыв длиной практически в 49млн пар оснований. Мда.

    Рис2. Разнообразие длин разрывов между контигами.




    Назад к странице третьего семестра.


    © Aleksei Efremov, 2015