Навигация по сайту
На Главную 1 семестр 2 семестр 3 семестр Здесь будут другие семестры Обо мне Официальный сайт ФББ МГУ
Архив был распакован командой gzip -d, качество до и после анализаровалось командой fastqc. Очистка при помощи trimmomatic, три последовательных шага: ILLUMINACLIP:adapters.fasta:2:7:7, TRAILING:20, MINLEN:30. Из 7400155 исходных ридов на первом шаге было отброшено 130310, на втором - 72100, на третьем - 204461. Итого из 7400155 ридов осталось 6993284. размер изменился с 782Мб до 737Мб.
FastQC "Per base quality" до и после чистки.
При помощи программы velveth двумя последовательными командами были созданы k-меры длиной 29 и собран геном на их основе
velveth kmers 29 -fastq -short srrmy_prd.fastq velvetg kmers
Для собраного генома N50 = 31053. Самые длинные контиги: ID 5, длина 82103, покрытие 47,9; ID 2, длина 70497, покрытие 49,6; ID 6, длина 49941, покрытие 48,6.
Также есть аномальные контиги: ID 23 обладает покрытием 234,6 при длние 1774; ID 59 имеет покрытие 10,2 при длине 740.
ID 5
Total score 29541 Query cover 69% E-value 0.0 Ident 77% Range 451729 - 529004
Было полученно 14 выравниваний: 11 больших с e-value 0.0 и 3 маленьких с e-value 1e-162, 5e-62, 2e-35. Все выравнивания имеют направленность +/+, Identities 74-90% и от 0 до 4% гэпов
ID 2
Total score 30964 Query cover 65% E-value 0.0 Ident 81% Range 529005 - 594099
Было полученно 8 выравниваний: 7 больших с e-value 0.0 и 1 маленькое с e-value 3.9e-72. Все выравнивания имеют направленность +/+, Identities 73-85% и от 0 до 4% гэпов
ID 6
Total score 21303 Query cover 79% E-value 0.0 Ident 75% Range 127825 - 173180
Было полученно 5 больших выравниваний с e-value 0.0. Все выравнивания имеют направленность +/+, Identities 75-80% и от 2 до 4% гэпов
Все контиги довольно хорошо легли на геном, но 5 большим количеством фрагментов. При этом 2 контиг ложится пряпо после 5. Лучше всего лег 6 контиг./p>