基本上有两个方法,一个是comm命令,一个是grep命令。分别介绍如下:
comm命令 , Compare sorted files FILE1 and FILE2 line by line. With no options, produce three-column output. Column one contains lines unique to FILE1, column two contains lines unique to FILE2, and column three contains lines common to both files. 要注意两个文件必须是排序和唯一(sorted and unique)的,默认输出为三列,第一列为是A-B,第二列B-A,第三列为A交B。
如果只想要交集,如下即可:
comm -12 <(sort a.txt|uniq ) <(sort b.txt|uniq )
grep 命令是常用的搜索文本内容的,要找交集,如下即可:
grep -F -f a.txt b.txt
grep不要求排序,但是因为是集合操作,唯一是必须的(不然怎么是集合呢?)。所以:
grep -F -f a.txt b.txt | sort | uniq
差集呢?
grep -F -v -f a.txt b.txt | sort | uniq
grep -F -v -f b.txt a.txt | sort | uniq
第一行结果为B-A,所以为空;第二行为A-B。注意顺序很重要!
sources:http://blog.csdn.net/autofei/article/details/6579320
No comments:
Post a Comment