我有两个CSV文件都有超过50000行,现在我只想查找两个CSV文件之间的匹配记录。我已经尝试了很多类似的Pandas函数,并且所有记录返回的响应都只有“ true”和“ false”。
如何只获取两个CSV之间的匹配列值?
df2 = id externalcode
1 00
2 00
df2 = id externalcode
1 00
2 00
任何帮助,将不胜感激。我尝试过的代码如下:
data_frame1 = pd.read_csv("one.csv")
data_frame2 = pd.read_csv("two.csv")
print(type(data_frame1),type(data_frame2))
result = data_frame1[data_frame1['id'] == data_frame2['id']]
df1 = data_frame1['id'].isin(data_frame2['id'])
df2 = data_frame1['values_externalCode'].isin(data_frame2['values_externalCode'])
问题来源:stackoverflow
df1 = data_frame1[data_frame1['id'].isin(list(data_frame2['id']))]
我修改了您的尝试之一,如果有效,请告诉我!因此,此代码将选择data_frame1中的ID,这些ID也将出现在data_frame2中。
回答来源:stackoverflow
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。