开发者社区> 问答> 正文

是否有任何内置的panda操作可以找到两个不同数据框的相似列?

我有两个dataframes,它们的列中有相似的数据,但是列名不同。我需要确定它们是否是相似的列。 colName1 = [‘movieName’,‘movieRating’,‘movieDirector’,‘movieReleaseDate’) colName2 =['名称',‘release_date’,‘导演’) 我的方法是标记colName1并使用它们进行比较 - levenshtein / Jaccard距离 -使用TFIDF评分查找相似性。 但是这个方法适用于col名称与eg名称相似的情况。movieName和名称。假设您有'IMDB_Score'和'average_rating',这种方法是行不通的。 是否有办法利用word2vec解决上述问题。 问题来源StackOverflow 地址:/questions/59386393/is-there-any-inbuilt-pandas-operation-which-can-find-similar-columns-of-two-diff

展开
收起
kun坤 2019-12-25 21:59:40 357 0
0 条回答
写回答
取消 提交回答
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载