交集
两个Dataframe,df1 和 df2
df_inner = pd.merge(df1,df2, how = 'inner', on = '关联字段')
差集
df1与df2的差集
将交集追加进df1,然后删除所有重复项
df1 = df1.append(df_inner)
df_diff = df1.drop_duplicates(subset=['列名(可选)'],keep=False)
并集
df1与df2的并集
将交集追加进df1,然后保留第一次出现的行,删除后面的重复行
df1 = df1.append(df_inner)
df_union = df1.drop_duplicates(subset=['列名(可选)'],keep='first')
keep = first 可以不写,默认值为first,也可等于last,表示保留最后一次出现的重复行
