Практикум №14

На главную На страницу третьего семестра

— — — — — — — —

Мой код доступа – SRR4240387.

Подготовка чтений программой trimmomatic

Для объединения адаптеров была использована команда "seqret '*.fa' /nfs/srv/databases/ngs/ivan.chernykh/adapters.fasta". Далее была проведена процедура триммирования командой "java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 SRR4240387.fastq srr_no_adapter.fastq ILLUMINACLIP:adapters.fasta:2:7:7". Результат выполнения команды:

 Input Reads: 15032810 Surviving: 15029735 (99,98%) Dropped: 3075 (0,02%) 
Далее были отобраны чтения длиной не менее 32 нуклеотидов, и у них были отрезаны с концов нуклеотиды с качеством ниже 20 командой "java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 srr_no_adapter.fastq srr_no_adapter_trim.fastq TRAILING:20 MINLEN:32". Результат выполнения программы:
 Input Reads: 15029735 Surviving: 3665895 (24,39%) Dropped: 11363840 (75,61%) 
Изначальный размер файла – 1691518134 B, после первого отбора ридов – 1690832406 B, после второго – 391978132 B.

Программа velveth

velveth . 31 -short -fastq srr_no_adapter_trim.fastq

Программа velvetg

Синтаксис программы - "velvetg . -cov_cutoff auto". N50 – 647.

Самые длинные контиги
ID Длина Покрытие
68 5807 24,094713
221 2952 19,468835
61 2918 23,164496
Контиги с аномально большим покрытием
ID Длина Покрытие
1209 1 458370
1210 1 6501
1204 2 319

Контиги с аномально малым покрытием отсутствуют.

Анализ

Описание выравниваний контигов
ID Координаты в хромосоме Число различий Гэпы Описание
68 36596 – 42429 894 49
Данный контиг является просто небольшим непрерывным участком хромосомы, он "ложится" на обратную цепь
221 552297 – 555138 488 66
Аналогично
61 543615 – 546571 507 65
Так же