关于R语言中的几个清洗函数(unique,setdiff,union,intersect)的用法
setdiff(x, y)求向量x与向量y中不同的元素(只取x中不同的元素)

setdiff(x=1:4,y=2:5)
[1] 1

unique(x)主要是返回一个把重复元素或行给删除的向量

z<-c(1,2,2,3,4)
unique(z)
[1] 1 2 3 4

unique(mydata[,1])删除列中所有重复向量。unique对于一个向量管用。

mydata
tid s1 s2
1 1 2 1
2 1 2 1
3 1 3 2
4 2 4 3
5 3 5 4
unique(mydata)
tid s1 s2
1 1 2 1
3 1 3 2
4 2 4 3
5 3 5 4
unique(mydata[,1])
[1] 1 2 3

union求两个向量的并集,集合可以是任何数值类型

intersect求两个向量的交集。