Описание команды comm
Для чего применяется команда comm?
comm - compare two sorted files line by line
Команда comm применяется в случаях, когда необходимо сравнить два файла, то есть найти в них одинаковые и отличающиеся элементы. С ее помощью comm можно сравнить белки, синтезируемые двумя какими-нибудь бактериями, и, например, найти одинаковые.
Как использовать comm?
В использовании comm есть несколько критериев, которые необходимо учесть перед началом использования команды. Они указаны даже в расшифровке названия команды (выделила курсивом). Во-первых, comm способен сравнивать только отсортированные по алфавиту файлы, а во-вторых, сравнение их содержимого производится построчно. Это означает, что прежде чем сравнивать файлы с помощью comm, их содержимое нужно упорядочить в строки по алфавиту.
Синтаксис comm: comm [option1] [option2]... file1 file2
где [option] - необходимая опция; file1 и file2 - сравниваемые файлы
Без использования какой-либо опции команда comm выводит на экран 3 колонки. В первой находятся строки, уникальные для file1, во второй - строки, уникальные для file2, в третьей - строки, общие для file1 и file2.
Пример1:
file 1: |
file 2: |
|
AAA |
AUG |
|
GGU |
GGU |
|
UAU |
GUC |
$ comm file1 file2
AAA AUG GGU GUC UAU
Опции comm
comm --nocheck-order
Опция --nocheck-order не проверяет корректность сортировки файлов и сравнивает их в введенном виде построчно. В таком виде использования comm важно не только наличие строки, но и её место в файле.
Пример2:
file 1: |
file 2: |
|
GGU |
GGU |
|
AUC |
AUG |
|
AAA |
GUC |
$ comm --nocheck-order file1 file2
Выход программы
GGU AUC AAA AUG GUC
comm --total
Опция --total позволяет подсчитать количество элементов в каждом столбце. На выходе будут получаться все те же три столбца, только к ним добавится еще одна строка в конце: это количество элементов в каждом из них.
Так, для Примера1, опция --total выведет под столбцами следующие значения:
$ comm --total file1 file2
AAA AUG GGU GUC UAU 2 2 1 total