На соответствующем сайте были скачаны чтения в формате fastq проекта по секвенированию бактерии Buchnera aphidicola str. Tuc7 (Acyrthosiphon pisum) с кодом доступа SRR4240379. Все рабочие файлы хранятся в директории /nfs/srv/databases/ngs/solera/pr14 , архив в том числе был распакован там.
| gunzip SRR4240379.fasrq.gz |
Для сборки генома требовалась предварительная подготовка чтений. Адапетрные последовательности, дабы удалить их остатки, были скопированы из папки /P/y16/term3/block3/adapters в файл adapters.fasta.
| cat /P/y15/term3/block4/adapters/*.fa > adapters.fasta |
|java -jar /usr/share/java/trimmomatic.jar SE -phred33 SRR4240379.fastq SRR4240379_out.fastq ILLUMINACLIP:adapters.fasta:2:7:7 Input Reads: 7400155 Surviving: 7269845 (98,24%) Dropped: 130310 (1,76%) |
|java -jar /usr/share/java/trimmomatic.jar SE -phred33 SRR4240379_out.fastq SRR4240379_seqout.fastq TRAILING:20 MINLEN:30 Input Reads: 7269845 Surviving: 6993284 (96,20%) Dropped: 276561 (3,80%) |
Характеристика чтений | SRR4240379.fastq | SRR4240379_out.fastq | SRR4240379_seqout.fastq |
Число оставшихся чтений | 7400155 | 7269845 | 6993284 |
Размер файла | 763 862 KB | 750 143 KB | 720 056 KB |
Первый этап сборки - подготовка k-меров (k=29 и k=25). Она была выполнена с помощью команды velveth пакета velveth, все файлы выхода были помещены в отдельную директорию vel или vel25 соответственно:
| velveth vel 29 -fastq -short SRR4240379_seqout.fastq | velveth vel25 25 -fastq -short SRR4240379_seqout.fastq |
По итогам работы данной программы в указанных директориях появились файлы Log, Roadmaps и Sequences с логом программы и обработанными последовательностями соответственно.
Затем командой velvetg была произведена сама сборка:
| velvetg vel Final graph has 2049 nodes and n50 of 47361, max 91528, total 723361, using 0/12549379 reads | velvetg vel25 Final graph has 4430 nodes and n50 of 5195, max 17284, total 731752, using 0/6993284 reads |
Graph LastGraph PreGraph contigs.fa stats.txt |
K29 | K25 | ||||
N50:47361 | N50:5195 | ||||
Число k-меров:2049 | Число k-меров:4430 | ||||
Контиги с максимальной длиной | |||||
ID:5,2,6 | ID:13,18,16 | ||||
lgth | short1_cov | short1_Ocov | lgth | short1_cov | short1_Ocov |
---|---|---|---|---|---|
82103 | 47.938394 | 47.936762 | 17284 | 77.501620 | 77.153321 |
70497 | 49.611544 | 49.607175 | 16308 | 73.563098 | 73.429728 |
49941 | 48.604493 | 48.599808 | 13450 | 85.422751 | 85.313606 |
Контиги с максимальным покрытием | |||||
ID:50, 68, 813 | ID:2011, 1467, 2485 | ||||
lgth | short1_cov | short1_Ocov | lgth | short1_cov | short1_Ocov |
64 | 98.015625 | 98.015625 | 3 | 99.333333 | 25.000000 |
13 | 94.307692 | 94.307692 | 15 | 99.133333 | 27.000000 |
1 | 92.000000 | 45.000000 | 3 | 99.000000 | 24.333333 |
Контиги с минимальным покрытием | |||||
ID:925, 928, 648 | ID:3642, 2858, 3610 | ||||
lgth | short1_cov | short1_Ocov | lgth | short1_cov | short1_Ocov |
6 | 1 | 1 | 10 | 1 | 1 |
5 | 1 | 1 | 9 | 1 | 1 |
4 | 1 | 1 | 9 | 1 | 1 |
Медиана значений по контигам | |||||
7 | 9,7671315 | 9,026316 | 5 | 5,8 | 5,5 |
Среднее для значений по контигам | |||||
705.9167 | 715,9939837 | 712,0242585 | 165,7047101 | 261,0510877 | 248,1754206 |
Таблица 2. Покрытия, длины контигов
Хотелось бы отметить, что контигов с минимальным покрытием 1 встречается очень много, а в таблице приведены только три первых из них
С помощью megablast (порог Evalue 0.01, длина слова 24) были получены выравнивания для трех самых длинных контигов с исследуемой хромосомой Buchnera aphidicola (GenBank/EMBL AC — CP009253).
Ниже представлены данные по ним - уже знакомым нам из Таблицы 2 контигам 5, 2 и 6, для каждого из которых после иллюстрации бласта следует таблица с описанием:
|
Таблица 3. Информация о бласт и хит-матрица для пятого контига
|
Таблица 4. Информация о бласт и хит-матрица для второго контига
|
Таблица 5. Информация о бласт и хит-матрица для шестого контига
Комментарий - координаты контигов считались крайними координатами совпадений в бласте
Сводная таблица:
ID | Total score | Query cover | E value | Identity | Начало | Конец |
---|---|---|---|---|---|---|
5 | 29541 | 69% | 0.0 | 77% | 451729 | 529004 |
2 | 31010 | 65% | 0.0 | 81% | 528977 | 594099 |
6 | 21303 | 79% | 0.0 | 75% | 127825 | 173180 |
На главную страницуВернуться назад
©Solonovich Vera,2017