一天一个shell命令 文本操作系列-comm命令用法

所属分类: 脚本专栏 / linux shell 阅读数: 1984
收藏 0 赞 0 分享

 comm命令比较两个已排序文件每行数据的差异,并将其结果显示出来,如果没有指定任何参数,comm命令读取这两个文件,然后生成三列输出:1>仅在file1中出现的行2>仅在file2中出现的行3>在两个文件中都存在的行。
  如果为文件名之一指定 -(减号),则 comm 命令会从标准输入设备读取数据。

题外话:说到比较文件,过来人都用过Beyond Compare,老版本时候,我们只能右键选中用于比较的文件,再选中被比较文件,对比。 如今他有了丰富的界面,支持linux上比较文件。 干什么用的?svn管理不善的时候,版本控制做的不好的时候,你就会期望他了。这都是经验- -!

回到正题:在shell中,也有个这么个命令---comm。 comm可用于两个文件之间的比较。可以用于文件的比较,交集,求差以及差集操作。

这个定义其实不够详细,应该是 comm逐行比较已排序的文件1和文件2.

全称:

(惭愧)没有找到合适的全称。 com 很明显是compare开头,m为mode。望高手指正。

查看—help

用法:comm [选项]... 文件1 文件2
逐行比较已排序的文件文件1 和文件2。

如果不附带选项,程序会生成三列输出。第一列包含文件1 特有的行,第二列包含 文件2 特有的行,而第三列包含两个文件共有的行。

  -1        不输出文件1 特有的行
  -2        不输出文件2 特有的行
  -3        不输出两个文件共有的行

  --check-order            检查输入是否被正确排序,即使所有输入行均成对
  --nocheck-order        不检查输入是否被正确排序
  --output-delimiter=STR    依照STR 分列

 解读:

1. --check-order

该命令默认情况下  如果希望不检验排序,可以--nocheck-order。

 2. --output-delimiter=STR

 STR 就是个表达式。 可以是任何非特殊字符

3. -1,-2

  可以写成 -12 与普通命令用起来一样

  实例:

1.建立A.txt

加入元素

apple
 orange
 gold
 silver
 steel
 iron

2. 建立B.txt

加入元素

orange
 gold
 cookies
 carrot

可以尝试直接比较: comm A.txt B.txt

你会发现提示一个错误,没有排序。

3. 排序

复制代码 代码如下:

sort A.txt -o A.txt; sort B.txt -o B.txt

4. 比较

复制代码 代码如下:

$comm A.txt B.txt

复制代码 代码如下:

apple  
      carrot  
      cookies  
                gold  
iron  
                orange  
silver  
steel

结果实际为3列 其中第一列是文件1特有 -1表示删除第一列

第二列是文件2特有的  -2代表删除第二列
第三列代表共同有的  -3代表删除共有的列

4.1 打印交集:

$comm –12 A.txt B.txt

4.2 打印两个文件中不同的行

$comm –3 A.txt B.txt

补充个小修改,两列不好看,用sed删除行首的\t

$comm –3 A.txt B.txt | sed 's/^\t//'

实战:

  comm在实战中,只会在一些非常特殊的场景中用到。 比较简单,就不举例了。(笔者遇到的场景中,仍然坚持有更好的方案时候,不用这个命令,呵呵)。

本文出自 “书生” 博客

更多精彩内容其他人还在看

linux whatis与whatis database 使用及查询方法(man使用实例)

在学习man命令时候,估计很多朋友都发现有man –f ,man –k 参数,可以查出很多数据。这些有的与man手册页相同,有些不是属于手册页的。它们数据怎么收集来的,并且whatis是怎么样工作的
收藏 0 赞 0 分享

linux dev 常见特殊设备介绍与应用(loop,null,zero,full,random)

这篇文章主要介绍了linux dev 常见特殊设备介绍与应用(loop,null,zero,full,random),需要的朋友可以参考下
收藏 0 赞 0 分享

linux shell命令快捷获得系统帮助(一)[man-pages定义规范]

linux命令帮助,一般有2种,命令自身代码里面带有使用帮助说明,这种一般很精简,太长了,程序自身的大小以及日常维护不方便。还有一种,就是带有帮助文件,类似windows的chm格式文件。下面我说下这2种怎么样查阅
收藏 0 赞 0 分享

linux shell实现随机数几种方法分享(date,random,uuid)

这篇文章主要介绍了linux shell实现随机数多种方法(date,random,uuid),需要的朋友可以参考下
收藏 0 赞 0 分享

linux shell 脚本实现tcp/upd协议通讯(重定向应用)

这篇文章主要介绍了linux shell 脚本实现tcp/upd协议通讯(重定向应用),需要的朋友可以参考下
收藏 0 赞 0 分享

linux shell数据重定向(输入重定向与输出重定向)详细分析

这篇文章主要介绍了linux shell数据重定向(输入重定向与输出重定向)详细分析,需要的朋友可以参考下
收藏 0 赞 0 分享

linux shell 管道命令(pipe)使用及与shell重定向区别

这篇文章主要介绍了linux shell 管道命令(pipe)使用及与shell重定向区别,需要的朋友可以参考下
收藏 0 赞 0 分享

Linux下使用tcpdump抓包的实现方法

tcpdump是Linux下面的一个开源的抓包工具,和Windows下面的wireshark抓包工具一样, 支持抓取指定网口、指定目的地址、指定源地址、指定端口、指定协议的数据。这篇文章主要介绍了Linux下使用tcpdump抓包的实现方法,需要的朋友可以参考下
收藏 0 赞 0 分享

零基础入门篇之Linux及Arm-Linux程序开发笔记

这篇文章主要介绍了零基础入门篇之Linux及Arm-Linux程序开发笔记,需要的朋友可以参考下
收藏 0 赞 0 分享

Linux 中 CURL常用命令详解

这篇文章主要介绍了Linux 中 CURL常用命令详解,需要的朋友可以参考下
收藏 0 赞 0 分享
查看更多