文字识别OCR这种非常规表格可以做到识别出来和常规表格一样吗?
您好,文字识别OCR的表格识别支持无线表格 识别
根据图片尺寸、大小、清晰度、像素等识别出来的结果会有所差异
可以测试一下无线表格的方式,需要调用api测试 https://help.aliyun.com/document_detail/442251.html?spm=a2c4g.442328.0.0.46e557375v7Kpe 此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”。
阿里云表格识别,是阿里云官方自研OCR文字识别产品,支持对多种表格格式(有线表格、条纹表格、无线表格)进行智能文字识别并结构化输出识别结果。
阿里云OCR产品基于阿里巴巴达摩院强大的AI技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作简易、实时性高、能力全面等几大优势。
接口核心能力
操作:是指具体的权限点。
访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
资源类型:是指操作中支持授权的资源类型。具体说明如下:
对于必选的资源类型,用背景高亮的方式表示。
对于不支持资源级授权的操作,用全部资源表示。
条件关键字:是指云产品自身定义的条件关键字。
关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
阿里云文字识别OCR服务可以用于非常规表格的识别,但对于非常规表格的识别结果可能会受到一些挑战。
对于常规的结构化表格,OCR服务通常可以较好地识别和提取表格中的内容,包括表头、行列数据等。这是因为常规表格具有明确的行列结构,并且单元格之间存在较为规律的布局。
然而,非常规表格往往具有不规则的布局、合并单元格、交叉线条等复杂特征,这就增加了识别的难度。在处理非常规表格时,文字识别OCR服务可能会面临以下挑战:
布局不规则:非常规表格的布局可能没有明确的行列结构,导致在识别和提取表格内容时困难增加。
合并单元格:非常规表格中常见的问题是单元格的合并,使得文本无法准确地与对应的行列对应起来。
交叉线条:一些非常规表格中可能存在交叉的线条,导致文字的覆盖或模糊,从而影响识别结果。
为了提高非常规表格的识别效果,可以尝试以下方法:
预处理:通过图像处理技术,如去噪、二值化、边缘检测等,对非常规表格进行预处理,以提高识别精度。
区域划分:根据表格的特征进行区域划分,尽可能将表格中的每个单元格单独处理,以减少合并单元格造成的干扰。
合并行列:根据行列的线条信息,将相邻且具有相同特征的单元格进行合并,以还原表格结构。
楼主你好,阿里云文字识别OCR可以识别非常规表格,但是识别效果可能与常规表格有所不同。对于非常规表格,OCR可能会出现行列错位、单元格合并、表格边框缺失等问题,需要对识别结果进行进一步的后处理和纠正。因此,在使用OCR识别非常规表格时,需要进行充分的测试和调整,以确保识别结果的准确性和可用性。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。