我刚开始使用Python。实际上,我正在建立一种新的方法来阅读专利数据。对于textrazor,应该分析该专利数据。我有兴趣获取主题并将其保存在术语文档矩阵中。我已经可以保存输出主题,但只能在一个具有很长向量的大单元格中保存。如何拆分这个长矢量,将主题保存在Excel文件的不同单元格中?
如果您对此问题有任何想法,我将感谢您的回答。另外,您可以随意推荐或帮助我使用我的代码。
data = open('Patentdaten1.csv') content= data.read() table=[] row = content.split('\n')
for i in range(len(row)): column= row[i].split(';') table.append(column)
patent1= table[1][1]
import textrazor
textrazor.api_key ="b033067632dba8a710c57f088115ad4eeff22142629bb1c07c780a10"
client = textrazor.TextRazor(extractors= ["entities", "categories", "topics"])
client.set_classifiers(['textrazor_newscodes'])
response = client.analyze(content)
topics= response.topics()
import pandas as pd
df = pd.DataFrame({'topic' : [topics]})
df.to_csv('test.csv')
在没有示例输入和/或输出的情况下确切地看到问题有点困难,但是通过pandas将数据保存到excel消除了对中间处理的任何需要:https: //pandas.pydata.org/pandas-docs/stable/参考/ API / pandas.DataFrame.to_excel.html
例如:
import pandas
data = pandas.DataFrame.from_dict({"pantents": ["p0", "p1"], "authors": ["a0", "a1"]})
data.to_excel("D:\test.xlsx")
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。