OCR以Excel格式输出的代码怎么搞啊?那个示例有点乱,没搞懂。
您好,官网OCR文字识别,目前接口返回的数据都是以json格式进行出参,暂时并不能将数据直接返回为Excel表格。如需Excel导出可查看云市场印刷文字识别—表格提取与excel导出,可支持对有线表格、条纹表格进行识别,并支持导出Excel功能,用户可进行二次编辑。
如果您有一个OCR扫描文档,并想要将其转换成Excel格式,可以使用一些OCR软件或在线OCR工具来实现。其中一些工具包括:
Adobe Acrobat Pro:该软件可将扫描文档转换成可编辑的PDF格式,然后您可以将PDF文件导入Excel中,或者使用Adobe Acrobat Pro将PDF文件转换成Excel格式。
ABBYY FineReader:该软件可以将扫描文档转换成可编辑的文本格式,并将其导入Excel中。该软件还提供了一些自定义选项,以便您可以更好地控制转换结果。
Online OCR:这是一个免费的在线OCR工具,它可以将扫描文档转换成可编辑的文本格式,并将其导出为Excel格式。您只需将扫描文档上传到该工具,然后选择要输出的格式即可。
在最下面部分,configure 里面,可以设置 format, 此回答整理自钉群“阿里云读光OCR客户交流反馈群 2”
阿里云 OCR的Excel输出功能可以通过调用API进行设置。
具体实现步骤如下:
在阿里云官网注册账号,并开通OCR 服务。
获取Access Key ID 和 Access Key Secret,用于后续的身份认证。
下载并安装Java SDK,这样才能调用阿里云的 OCR API。
在Java代码中实现调用OCR API,并设置outputFormat参数为excel。代码示例:
DefaultProfile profile = DefaultProfile.getProfile("cn-hangzhou", "<Access_Key_ID>", "<Access_Key_Secret>");
IAcsClient client = new DefaultAcsClient(profile);
RecognizeTableRequest request = new RecognizeTableRequest();
request.setMethod(MethodType.POST);
request.setHttpContent(content.getBytes("UTF-8"), "UTF-8", FormatType.JSON);
request.setAcceptFormat(FormatType.JSON);
request.setEndpoint("ocr.cn-hangzhou.aliyuncs.com");
request.setOutputFormat("excel");
RecognizeTableResponse response = client.getAcsResponse(request);
其中,Access_Key_ID 和 Access_Key_Secret 分别是您的阿里云全局账号的Access Key ID和 Access Key Secret,content则为需要识别的图像文件,可以是byte数组或者文件路径。
以上是关于阿里云OCR以Excel格式输出的基本实现流程。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。