哈喽,文档智能的OCR 表格识别,这里Python怎么能直接获取excel结果导出呢?
用这个ocr https://market.aliyun.com/products/57124001/cmapi024968.html?spm=5176.730005.result.10.7676352437vFoX&innerSource=search_%E8%A1%A8%E6%A0%BC%E8%AF%86%E5%88%AB#sku=yuncode1896800000 ,此回答整理自钉群“【官方】阿里云文档智能客户交流群”
阿里云云效的文档智能OCR表格识别功能可将图片中的表格内容转换为结构化数据。你可以通过以下步骤使用Python将识别结果导出到Excel:
首先,确保你已经安装了相应的 Python 包,包括 Aliyun Python SDK 和 openpyxl。
在你的 Python 代码中导入必要的库和模块:
import json
from aliyunsdkcore import client
from aliyunsdkocr.request.v20191230 import RecognizeTableOCRRequest
from openpyxl import Workbook
clt = client.AcsClient(
"your_access_key_id",
"your_access_key_secret",
"your_region_id" # 如:cn-shanghai
)
req = RecognizeTableOCRRequest.RecognizeTableOCRRequest()
req.set_ImageURL("your_image_url") # 图片的 URL
req.set_OutputType("excel") # 输出格式为 Excel
req.set_OutputFileSuffix(".xlsx") # 输出文件后缀
response = clt.do_action_with_exception(req)
result = json.loads(response.decode("utf-8"))
wb = Workbook()
ws = wb.active
tables = result["Tables"]
for table in tables:
rows = table["Rows"]
for row in rows:
cells = row["Cells"]
row_data = []
for cell in cells:
row_data.append(cell["Text"])
ws.append(row_data)
wb.save("output.xlsx") # 导出结果到 Excel 文件
在上述代码中,你需要替换 "your_access_key_id"
、"your_access_key_secret"
和 "your_region_id"
分别为你的阿里云访问密钥ID、访问密钥Secret和相应的区域ID。同时,将 "your_image_url"
替换为你要识别的图片的URL。
通过以上步骤,你可以使用 Python 调用阿里云云效的文档智能OCR表格识别功能,并将识别结果导出到 Excel 文件中。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
云效,企业级一站式研发协同平台,数十万企业都在用。支持公共云、专有云和混合云多种部署形态,通过云原生新技术和研发新模式,助力创新创业和数字化转型企业快速实现研发敏捷和组织敏捷,打造“双敏”组织,实现多倍效能提升。