На главную На страницу третьего семестра
— — — — — — — —
Мой код доступа – SRR4240387.
Подготовка чтений программой trimmomatic
Для объединения адаптеров была использована команда "seqret '*.fa' /nfs/srv/databases/ngs/ivan.chernykh/adapters.fasta". Далее была проведена процедура триммирования командой "java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 SRR4240387.fastq srr_no_adapter.fastq ILLUMINACLIP:adapters.fasta:2:7:7". Результат выполнения команды:
Input Reads: 15032810 Surviving: 15029735 (99,98%) Dropped: 3075 (0,02%)Далее были отобраны чтения длиной не менее 32 нуклеотидов, и у них были отрезаны с концов нуклеотиды с качеством ниже 20 командой "java -jar /nfs/srv/databases/ngs/suvorova/trimmomatic/trimmomatic-0.30.jar SE -phred33 srr_no_adapter.fastq srr_no_adapter_trim.fastq TRAILING:20 MINLEN:32". Результат выполнения программы:
Input Reads: 15029735 Surviving: 3665895 (24,39%) Dropped: 11363840 (75,61%)Изначальный размер файла – 1691518134 B, после первого отбора ридов – 1690832406 B, после второго – 391978132 B.
Программа velveth
velveth . 31 -short -fastq srr_no_adapter_trim.fastq
Программа velvetg
Синтаксис программы - "velvetg . -cov_cutoff auto". N50 – 647.
ID | Длина | Покрытие |
---|---|---|
68 | 5807 | 24,094713 |
221 | 2952 | 19,468835 |
61 | 2918 | 23,164496 |
ID | Длина | Покрытие |
---|---|---|
1209 | 1 | 458370 |
1210 | 1 | 6501 |
1204 | 2 | 319 |
Контиги с аномально малым покрытием отсутствуют.
Анализ
ID | Координаты в хромосоме | Число различий | Гэпы | Описание |
---|---|---|---|---|
68 | 36596 – 42429 | 894 | 49 | ![]() Данный контиг является просто небольшим непрерывным участком хромосомы, он "ложится" на обратную цепь |
221 | 552297 – 555138 | 488 | 66 | ![]() Аналогично |
61 | 543615 – 546571 | 507 | 65 | ![]() Так же |