开发者社区 > 云效DevOps > 正文

哈喽,文档智能的OCR 表格识别,这里Python怎么能直接获取excel结果导出呢?!

哈喽,文档智能的OCR 表格识别,这里Python怎么能直接获取excel结果导出呢?49a29f0e10ccb8f16b335d3ac3e9ab0f.png

展开
收起
真的很搞笑 2023-06-27 11:16:00 150 0
2 条回答
写回答
取消 提交回答
  • 用这个ocr https://market.aliyun.com/products/57124001/cmapi024968.html?spm=5176.730005.result.10.7676352437vFoX&innerSource=search_%E8%A1%A8%E6%A0%BC%E8%AF%86%E5%88%AB#sku=yuncode1896800000bc3f53260832d366795e8dcc7eab5b83.png ,此回答整理自钉群“【官方】阿里云文档智能客户交流群”

    2023-06-27 11:48:19
    赞同 展开评论 打赏
  • 阿里云云效的文档智能OCR表格识别功能可将图片中的表格内容转换为结构化数据。你可以通过以下步骤使用Python将识别结果导出到Excel:

    1. 首先,确保你已经安装了相应的 Python 包,包括 Aliyun Python SDK 和 openpyxl。

    2. 在你的 Python 代码中导入必要的库和模块:

    import json
    from aliyunsdkcore import client
    from aliyunsdkocr.request.v20191230 import RecognizeTableOCRRequest
    from openpyxl import Workbook
    
    1. 创建阿里云 OCR 客户端对象,并设置 API 访问凭据:
    clt = client.AcsClient(
        "your_access_key_id",
        "your_access_key_secret",
        "your_region_id"  # 如:cn-shanghai
    )
    
    1. 构造 OCR 请求并调用接口进行表格识别:
    req = RecognizeTableOCRRequest.RecognizeTableOCRRequest()
    req.set_ImageURL("your_image_url")  # 图片的 URL
    req.set_OutputType("excel")  # 输出格式为 Excel
    req.set_OutputFileSuffix(".xlsx")  # 输出文件后缀
    
    response = clt.do_action_with_exception(req)
    result = json.loads(response.decode("utf-8"))
    
    1. 处理表格识别结果,并将其导出到 Excel 文件:
    wb = Workbook()
    ws = wb.active
    
    tables = result["Tables"]
    
    for table in tables:
        rows = table["Rows"]
      
        for row in rows:
            cells = row["Cells"]
            row_data = []
          
            for cell in cells:
                row_data.append(cell["Text"])
          
            ws.append(row_data)
    
    wb.save("output.xlsx")  # 导出结果到 Excel 文件
    

    在上述代码中,你需要替换 "your_access_key_id""your_access_key_secret""your_region_id" 分别为你的阿里云访问密钥ID、访问密钥Secret和相应的区域ID。同时,将 "your_image_url" 替换为你要识别的图片的URL。

    通过以上步骤,你可以使用 Python 调用阿里云云效的文档智能OCR表格识别功能,并将识别结果导出到 Excel 文件中。

    2023-06-27 11:25:59
    赞同 展开评论 打赏

云效,企业级一站式研发协同平台,数十万企业都在用。支持公共云、专有云和混合云多种部署形态,通过云原生新技术和研发新模式,助力创新创业和数字化转型企业快速实现研发敏捷和组织敏捷,打造“双敏”组织,实现多倍效能提升。

相关电子书

更多
From Python Scikit-Learn to Sc 立即下载
Data Pre-Processing in Python: 立即下载
双剑合璧-Python和大数据计算平台的结合 立即下载