星空网 > 软件开发 > 操作系统

Linux 对比两个文本的交集和差集(comm)

介绍

comm命令可以对两个已排序好的文本的内容进行交集和差集的对比,记住必须是已排序过的文件;可以使用sort命令对没有排序的文件进行排序,comm命令在对比结果中会产生三列分别是:在A中不在B中的内容,在B中不在A中的内容,AB的交集的内容。

 

 

事例

[root@localhost test]# cat a3 c2 b1 a[root@localhost test]# cat b2 b3 c4 d

其中文件a不是倒序的文件,看看直接拿来对比会出现什么问题。

[root@localhost test]# comm a b  2 b    3 ccomm: file 1 is not in sorted order2 b1 a  4 d

对比结果出现了问题提示文件1不是已排序的文件。

1.对文件进行排序

[root@localhost test]# sort a -o a[root@localhost test]# cat a1 a2 b3 c

2.对比文件

[root@localhost test]# comm a b1 a    2 b    3 c  4 d

第一列:在a文件中不在b文件中的内容

第二列:在b文件中不在a文件中的内容

第三列:a文件和b文件的交集

comm命令参数

-1:不显示第一列

-2:不显示第二列

-3:不显示第三列

[root@localhost test]# comm a b -1  2 b  3 c4 d[root@localhost test]# comm a b -21 a  2 b  3 c[root@localhost test]# comm a b -31 a  4 d[root@localhost test]# comm a b -122 b3 c

其它的一些特殊处理方法

[root@localhost test]# comm a b -31 a  4 d[root@localhost test]# comm a b -3 | sed 's/^\t//'1 a4 d

可以使用sed命令将开头的制表符(tab)替换掉,s:替换的意思,^:以什么开头,\t:制表符,//:空

总结

 

 

 

 

备注:

    作者:pursuer.chen

    博客:http://www.cnblogs.com/chenmh

本站点所有随笔都是原创,欢迎大家转载;但转载时必须注明文章来源,且在文章开头明显处给明链接。

《欢迎交流讨论》






原标题:Linux 对比两个文本的交集和差集(comm)

关键词:linux

*特别声明:以上内容来自于网络收集,著作权属原作者所有,如有侵权,请联系我们: admin#shaoqun.com (#换成@)。

加拿大海外仓服务:https://www.goluckyvip.com/tag/95853.html
澳洲海外仓服务:https://www.goluckyvip.com/tag/95854.html
海外仓提供的服务包括:https://www.goluckyvip.com/tag/95856.html
海外仓服务优势:https://www.goluckyvip.com/tag/95859.html
避免罚款:https://www.goluckyvip.com/tag/9586.html
海外仓服务内容:https://www.goluckyvip.com/tag/95860.html
上海滑雪场门票价格?:https://www.vstour.cn/a/408235.html
德国有那些品牌公司:https://www.vstour.cn/a/408236.html
相关文章
我的浏览记录
最新相关资讯
海外公司注册 | 跨境电商服务平台 | 深圳旅行社 | 东南亚物流