Сборка de novo

Меню

На главную

Третий семестр

Программой velveth были выделены k-меры длины 31 и velvetg собраны контиги на основе графа k-меров. N50=293, максимальная длина контига 1339.
Использовала следующие команды:
velveth chr9_1 31 -fastq chr9_1c.fastq
velvetg chr9_1 > chr9_1d

Была создана база из референса в blastn и построены парные выравнивания контигов с хромосомой.
Команды:
makeblastdb -in chr9.fasta -dbtype nucl
blastn -db chr9.fasta -query chr9_1/contigs.fa -outfmt 6 -out algn_chr9.out
Контиги, окартированные единожды(257 штук) приведены в таблице (отсортированы по началу в хромосоме). Всего 279 контигов. Не все контиги откартированы единственным образом(таких 22 штуки). (Рис.1) Самый частый контиг note_58 соответствует белку Janus kinase 2. Это очень важный белок: эмбрионы крыс без него умирают на 12 день.
Контиги 197 и 199 не перекрываются. Координата конца 197 есть координата начала 199, но в на этой позиции стоят разные нуклеотиды. Из-за SNP эти контиги не объединены в один большой. (Рис.2.)

Рис.1 Количество контигов.

Рис.2. Фрагмент таблицы с контигами, откартированными на геном единожды: контиги 197 и 199.


© Корзина Анастасия, 2015