Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2023

Ответы к упражнениям

Здесь можно подсмотреть, как правильно выполнять упражнения по мнению преподавателей (по крайней мере некоторых :-) ). Даже если справились со всем самостоятельно, не помешает сверить ваши решения с предложенными.

#1
$ mkdir ~/term1/pr5
$ cd ~/term1/pr5
#2
$ less ~/term1/genome/*_feature_table.txt
#3
 -- -N показать номера строк
 -- -S не переносить длинные строки (можно использовать стрелочки влево/вправо для перемещения)
 -- -U заменить некоторые символы (Tab, CR, Backspace, ...) на обозначения, чтобы их стало видно (соотв. ^I, ^M, ^H, ...).
#4
$ cut -f 1 ~/term1/genome/*_feature_table.txt > col1.txt
$ cut -f 1,2 ~/term1/genome/*_feature_table.txt > cols.txt
#5
$ wc -l ~/term1/genome/*_feature_table.txt
$ wc -l col*.txt
#6
$ sort cols.txt | uniq
или
$ sort -u cols.txt # этот вариант лучше
#7
$ sort -u cols.txt | less
#8
$ uniq -c col1.txt # делает не то, что вы ожидаете; читайте man uniq!
$ sort col1.txt | uniq -c # работает правильно
#9
$ sort cols.txt | uniq -c
#10
$ sort col1.txt | uniq -c | sort -n | less
#11
$ head -n 5 ~/term1/genome/*_feature_table.txt > rows.tsv
#12
$ tail -n '+2' ~/term1/genome/*_feature_table.txt | less
 -- у tail -n означает "вывести, начиная со строки с номером", если аргумент опции начинается с +
 -- то есть выводим со строки №2, пропуская первую
#13
$ head -n 1 ~/term1/genome/*_feature_table.txt | tr '\t' '\n' | less
 -- вырезаем первую строку, заменяем в ней все символы табуляции на символы переноса строки
 -- полный список обозначений, которые понимает tr, есть в man tr
#14
$ cut -f 1 ~/term1/genome/*_feature_table.txt | sort -u
 -- узнаем, какие вообще значения встречаются в колонке
 -- замечаем, что есть несколько типов РНК, причем всегда написано RNA заглавными буквами, а тип РНК указан строчными буквами
$ cut -f 1 ~/term1/genome/*_feature_table.txt | tr -d '[:lower:]' | sort | uniq -c
 -- удаляем все строчные буквы из значений, чтобы все RNA посчитались вместе (не самим же числа складывать)
#15
$ cut -f 8-10 ~/term1/genome/*_feature_table.txt | tr '+-' '10' | less
#16
$ tail -n+2 ~/term1/genome/*_feature_table.txt | cut -f 8,9  | tr '\t' '\n' | sort -u | wc -l

2023/1/hints5 (последним исправлял пользователь is_rusinov 2023-10-11 14:24:35)