Учебный сайт Кузнецовой Марии

Главная

Первый семестр

Второй семестр

Третий семестр

Ссылки

Об авторе

Поиск однонуклеотидных полиморфизмов и инделей

С помощью программ samtools и bcftools получила список однонуклеотидных полиморфизмов (SNP) и инделей (то есть делеций и инсерций) для ридов, картированных на геномы хлоропласта и митохондрии из предыдущего задания. Ссылка на файл со списком. Инделей нашлось 308, а полиморфизмов 644. Использованные команды:

samtools mpileup -ugf 1.fasta aln.sorted.bam > 1.bcf
bcftools view -vcg 1.bcf > 1.vcf
grep 'INDEL;' 1.vcf | wc -l
grep 'DP=' 1.vcf | wc -l

Сборка хлоропласта и митохондрии

Собрала геномы хлоропласта и митохондрии из всех чтений своего набора (прошедших очистку) пакетом velvet. Для десяти самых длинных контигов составила таблицу: номер контига, длина контига, откуда эта последовательность.

Final graph has 715299 nodes and n50 of 141, max 4849, total 58721103, using 0/3758903 reads

По созданным датабазам был проведен локальный бласт контигов с геномами хлоропласта и митохондрии. Результаты ниже:

ГеномНомерДлина
Хлоропласт43215381
Митохондрия188265314
Хлоропласт650375210
Митохондрия6715154
Митохондрия65355030
Митохондрия103494838
Митохондрия252974705
Митохондрия460104697
Митохондрия55044325
Митохондрия180184281
# BLASTN 2.2.28+
# Query: NODE_671_length_5154_cov_24.911718
# Database: 1.fasta
# Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score
# 3 hits found
NODE_671_length_5154_cov_24.911718	ENA|Y08501|Y08501.2	100.00	5184	0	0	1	5184	118736	113553	0.0	9574
NODE_671_length_5154_cov_24.911718	ENA|Y08501|Y08501.2	100.00	5184	0	0	1	5184	290991	296174	0.0	9574
NODE_671_length_5154_cov_24.911718	ENA|Y08501|Y08501.2	100.00	30	0	0	5155	5184	138257	138228	3e-08	56.5
# BLASTN 2.2.28+
# Query: NODE_4321_length_5381_cov_15.537818
# Database: 1.fasta
# Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score
# 3 hits found
NODE_4321_length_5381_cov_15.537818	ENA|Y08501|Y08501.2	99.94	5413	1	2	1	5411	341135	335723	0.0	9978
NODE_4321_length_5381_cov_15.537818	ENA|Y08501|Y08501.2	100.00	30	0	0	5382	5411	349868	349839	3e-08	56.5
NODE_4321_length_5381_cov_15.537818	ENA|AP000423|AP000423.1	92.21	77	5	1	3391	3466	52132	52056	7e-24	 108
# BLASTN 2.2.28+
# Query: NODE_5504_length_4325_cov_13.203931
# Database: 1.fasta
# Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score
# 2 hits found
NODE_5504_length_4325_cov_13.203931	ENA|Y08501|Y08501.2	99.89	4356	1	4	1	4355	12517	16869	0.0	8013
NODE_5504_length_4325_cov_13.203931	ENA|Y08501|Y08501.2	100.00	30	0	0	1	30	98738	98709	2e-08	56.5
# BLASTN 2.2.28+
# Query: NODE_6535_length_5030_cov_11.678529
# Database: 1.fasta
# Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score
# 2 hits found
NODE_6535_length_5030_cov_11.678529	ENA|Y08501|Y08501.2	99.96	5060	0	2	1	5060	209984	215041	0.0	9332
NODE_6535_length_5030_cov_11.678529	ENA|Y08501|Y08501.2	100.00	30	0	0	5031	5060	223487	223516	3e-08	56.5
# BLASTN 2.2.28+
# Query: NODE_10349_length_4838_cov_14.158950
# Database: 1.fasta
# Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score
# 2 hits found
NODE_10349_length_4838_cov_14.158950	ENA|Y08501|Y08501.2	99.94	4870	0	3	1	4868	308940	313808	0.0	8973
NODE_10349_length_4838_cov_14.158950	ENA|Y08501|Y08501.2	76.00	125	26	4	1	124	308871	308992	5e-10	62.1
# BLASTN 2.2.28+
# Query: NODE_18018_length_4281_cov_16.986452
# Database: 1.fasta
# Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score
# 2 hits found
NODE_18018_length_4281_cov_16.986452	ENA|Y08501|Y08501.2	99.26	4334	7	25	1	4311	98738	94407	0.0	7803
NODE_18018_length_4281_cov_16.986452	ENA|Y08501|Y08501.2	100.00	30	0	0	1	30	12517	12546	2e-08	56.5
# BLASTN 2.2.28+
# Query: NODE_18826_length_5314_cov_9.643583
# Database: 1.fasta
# Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score
# 1 hits found
NODE_18826_length_5314_cov_9.643583	ENA|Y08501|Y08501.2	99.98	5344	1	0	1	5344	162615	167958	0.0	9864
# BLASTN 2.2.28+
# Query: NODE_25297_length_4705_cov_15.044846
# Database: 1.fasta
# Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score
# 2 hits found
NODE_25297_length_4705_cov_15.044846	ENA|Y08501|Y08501.2	99.87	4737	4	2	1	4735	328381	323645	0.0	8713
NODE_25297_length_4705_cov_15.044846	ENA|Y08501|Y08501.2	100.00	30	0	0	1	30	267017	266988	2e-08	56.5
# BLASTN 2.2.28+
# Query: NODE_46010_length_4697_cov_12.152225
# Database: 1.fasta
# Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score
# 1 hits found
NODE_46010_length_4697_cov_12.152225	ENA|Y08501|Y08501.2	99.89	4732	0	4	1	4727	236943	232212	0.0	8706
# BLASTN 2.2.28+
# Query: NODE_65037_length_5210_cov_12.110941
# Database: 1.fasta
# Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score
# 2 hits found
NODE_65037_length_5210_cov_12.110941	ENA|Y08501|Y08501.2	99.75	5243	1	12	1	5240	259575	254342	0.0	9600
NODE_65037_length_5210_cov_12.110941	ENA|AP000423|AP000423.1	97.01	67	2	0	5174	5240	39553	39619	2e-25	 113
# BLAST processed 10 queries

Дата последнего обновления: 15.09.2014
Copyright © Кузнецова Мария, 2013.