С помощью программ samtools и bcftools получила список однонуклеотидных полиморфизмов (SNP) и инделей (то есть делеций и инсерций) для ридов, картированных на геномы хлоропласта и митохондрии из предыдущего задания. Ссылка на файл со списком. Инделей нашлось 308, а полиморфизмов 644. Использованные команды:
samtools mpileup -ugf 1.fasta aln.sorted.bam > 1.bcf bcftools view -vcg 1.bcf > 1.vcf grep 'INDEL;' 1.vcf | wc -l grep 'DP=' 1.vcf | wc -l
Собрала геномы хлоропласта и митохондрии из всех чтений своего набора (прошедших очистку) пакетом velvet. Для десяти самых длинных контигов составила таблицу: номер контига, длина контига, откуда эта последовательность.
Final graph has 715299 nodes and n50 of 141, max 4849, total 58721103, using 0/3758903 reads
По созданным датабазам был проведен локальный бласт контигов с геномами хлоропласта и митохондрии. Результаты ниже:
Геном | Номер | Длина |
Хлоропласт | 4321 | 5381 |
Митохондрия | 18826 | 5314 |
Хлоропласт | 65037 | 5210 |
Митохондрия | 671 | 5154 |
Митохондрия | 6535 | 5030 |
Митохондрия | 10349 | 4838 |
Митохондрия | 25297 | 4705 |
Митохондрия | 46010 | 4697 |
Митохондрия | 5504 | 4325 |
Митохондрия | 18018 | 4281 |
# BLASTN 2.2.28+ # Query: NODE_671_length_5154_cov_24.911718 # Database: 1.fasta # Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score # 3 hits found NODE_671_length_5154_cov_24.911718 ENA|Y08501|Y08501.2 100.00 5184 0 0 1 5184 118736 113553 0.0 9574 NODE_671_length_5154_cov_24.911718 ENA|Y08501|Y08501.2 100.00 5184 0 0 1 5184 290991 296174 0.0 9574 NODE_671_length_5154_cov_24.911718 ENA|Y08501|Y08501.2 100.00 30 0 0 5155 5184 138257 138228 3e-08 56.5 # BLASTN 2.2.28+ # Query: NODE_4321_length_5381_cov_15.537818 # Database: 1.fasta # Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score # 3 hits found NODE_4321_length_5381_cov_15.537818 ENA|Y08501|Y08501.2 99.94 5413 1 2 1 5411 341135 335723 0.0 9978 NODE_4321_length_5381_cov_15.537818 ENA|Y08501|Y08501.2 100.00 30 0 0 5382 5411 349868 349839 3e-08 56.5 NODE_4321_length_5381_cov_15.537818 ENA|AP000423|AP000423.1 92.21 77 5 1 3391 3466 52132 52056 7e-24 108 # BLASTN 2.2.28+ # Query: NODE_5504_length_4325_cov_13.203931 # Database: 1.fasta # Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score # 2 hits found NODE_5504_length_4325_cov_13.203931 ENA|Y08501|Y08501.2 99.89 4356 1 4 1 4355 12517 16869 0.0 8013 NODE_5504_length_4325_cov_13.203931 ENA|Y08501|Y08501.2 100.00 30 0 0 1 30 98738 98709 2e-08 56.5 # BLASTN 2.2.28+ # Query: NODE_6535_length_5030_cov_11.678529 # Database: 1.fasta # Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score # 2 hits found NODE_6535_length_5030_cov_11.678529 ENA|Y08501|Y08501.2 99.96 5060 0 2 1 5060 209984 215041 0.0 9332 NODE_6535_length_5030_cov_11.678529 ENA|Y08501|Y08501.2 100.00 30 0 0 5031 5060 223487 223516 3e-08 56.5 # BLASTN 2.2.28+ # Query: NODE_10349_length_4838_cov_14.158950 # Database: 1.fasta # Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score # 2 hits found NODE_10349_length_4838_cov_14.158950 ENA|Y08501|Y08501.2 99.94 4870 0 3 1 4868 308940 313808 0.0 8973 NODE_10349_length_4838_cov_14.158950 ENA|Y08501|Y08501.2 76.00 125 26 4 1 124 308871 308992 5e-10 62.1 # BLASTN 2.2.28+ # Query: NODE_18018_length_4281_cov_16.986452 # Database: 1.fasta # Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score # 2 hits found NODE_18018_length_4281_cov_16.986452 ENA|Y08501|Y08501.2 99.26 4334 7 25 1 4311 98738 94407 0.0 7803 NODE_18018_length_4281_cov_16.986452 ENA|Y08501|Y08501.2 100.00 30 0 0 1 30 12517 12546 2e-08 56.5 # BLASTN 2.2.28+ # Query: NODE_18826_length_5314_cov_9.643583 # Database: 1.fasta # Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score # 1 hits found NODE_18826_length_5314_cov_9.643583 ENA|Y08501|Y08501.2 99.98 5344 1 0 1 5344 162615 167958 0.0 9864 # BLASTN 2.2.28+ # Query: NODE_25297_length_4705_cov_15.044846 # Database: 1.fasta # Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score # 2 hits found NODE_25297_length_4705_cov_15.044846 ENA|Y08501|Y08501.2 99.87 4737 4 2 1 4735 328381 323645 0.0 8713 NODE_25297_length_4705_cov_15.044846 ENA|Y08501|Y08501.2 100.00 30 0 0 1 30 267017 266988 2e-08 56.5 # BLASTN 2.2.28+ # Query: NODE_46010_length_4697_cov_12.152225 # Database: 1.fasta # Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score # 1 hits found NODE_46010_length_4697_cov_12.152225 ENA|Y08501|Y08501.2 99.89 4732 0 4 1 4727 236943 232212 0.0 8706 # BLASTN 2.2.28+ # Query: NODE_65037_length_5210_cov_12.110941 # Database: 1.fasta # Fields: query id, subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score # 2 hits found NODE_65037_length_5210_cov_12.110941 ENA|Y08501|Y08501.2 99.75 5243 1 12 1 5240 259575 254342 0.0 9600 NODE_65037_length_5210_cov_12.110941 ENA|AP000423|AP000423.1 97.01 67 2 0 5174 5240 39553 39619 2e-25 113 # BLAST processed 10 queries
Дата последнего обновления: 15.09.2014
Copyright © Кузнецова Мария, 2013.