Семестры Домой Проекты Обо мне

Однонуклеотидные полиморфизмы, индели и сборка

Упр.1.Поиск однонуклеотидных полиморфизмов и инделей

Для того, чтобы программа bcftools смогла работать, нужно перевести файлы в формат *.bcf. С помощью программ samtools и bcftools получиv список однонуклеотидных полиморфизмов и инделей для ридов, картированных на геномы хлоропласта и митохондрии из предыдущего задания. Создание файла с расширением *.bcf выглядит так:

samtools mpileup -ugf Mit+Chl.fasta aln_mc_out_1.sorted.bam > reads.bcf

Теперь посчитаем количество инделей и полиморфизмов с помощью команды:

bcftools view -vcg reads.bcf > reads_1.vcf

Здесь лежит сам файл *.vcf

Количество инделей и полиморфизмов:
INDEL 308
DP 644

Упр.2.Сборка хлоропласта и митохондрии

1) Осуществим сборку генома хлоропласта и митохондрии из всех чтений набора пакетом velvet.

1.1) Создадим банк k-меров длины 31, используя команду:

velveth velveth_out 31  -fastq  Ath_tae_008_1.fastq

1.2) Соединим k-меры в контиги, используя команду:

velvetg velveth_out -cov_cutoff auto

На выходе получено сообщение:

Final graph has 666166 nodes and n50 of 137, max 5630, total 55860589, using 0/3752156 reads

2) Таблица для десяти самых длинных контигов, для сортировки использовались возможности Excel:
ID lgth out in long_cov short1_cov short1_Ocov short2_cov short2_Ocov long_nb short1_nb short2_nb
6192 5630 2 1 0.000000 12.168384 12.143872 0.000000 0.000000 0 0 0
10316 4849 1 2 0.000000 11.217777 11.164570 0.000000 0.000000 0 0 0
17992 4181 1 1 0.000000 11.545085 11.505142 0.000000 0.000000 0 0 0
10549 3510 1 2 0.000000 8.703704 8.659544 0.000000 0.000000 0 0 0
10621 3380 1 1 0.000000 10.784615 10.737278 0.000000 0.000000 0 0 0
7791 3360 1 1 0.000000 11.751488 11.687202 0.000000 0.000000 0 0 0
1421 3147 1 1 0.000000 11.730855 11.721004 0.000000 0.000000 0 0 0
13761 3039 1 1 0.000000 10.951958 10.919381 0.000000 0.000000 0 0 0
217952 3034 1 2 0.000000 13.008899 12.996704 0.000000 0.000000 0 0 0

Контакты
Ленинские горы МГУ 1, стр. 73
8-916-939-49-78
jiabicht@rambler.ru
vk.com/allweiss
FBBФакультет Биоинженерии и Биоинформатики