python_求交集、差集、并集

交集

两个Dataframe,df1 和 df2

df_inner = pd.merge(df1,df2, how = 'inner', on = '关联字段')

差集

df1与df2的差集

将交集追加进df1,然后删除所有重复项

df1 = df1.append(df_inner)
df_diff = df1.drop_duplicates(subset=['列名(可选)'],keep=False)

并集

df1与df2的并集

将交集追加进df1,然后保留第一次出现的行,删除后面的重复行

df1 = df1.append(df_inner)
df_union = df1.drop_duplicates(subset=['列名(可选)'],keep='first')

keep = first 可以不写,默认值为first,也可等于last,表示保留最后一次出现的重复行

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容