我有两个dataframes,它们的列中有相似的数据,但是列名不同。我需要确定它们是否是相似的列。 colName1 = [‘movieName’,‘movieRating’,‘movieDirector’,‘movieReleaseDate’) colName2 =['名称',‘release_date’,‘导演’) 我的方法是标记colName1并使用它们进行比较 - levenshtein / Jaccard距离 -使用TFIDF评分查找相似性。 但是这个方法适用于col名称与eg名称相似的情况。movieName和名称。假设您有'IMDB_Score'和'average_rating',这种方法是行不通的。 是否有办法利用word2vec解决上述问题。 问题来源StackOverflow 地址:/questions/59386393/is-there-any-inbuilt-pandas-operation-which-can-find-similar-columns-of-two-diff
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。