印刷文字识别使用问题之是否支持对比两个图片的准确度
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
MongoDB 4.2 新特性解读
MongoDB World 2019 上发布新版本 MongoDB 4.2 Beta,包含分布式事务、全文检索、Wildcard 索引等多项数据库新特性,本文尝试从技术角度解读。
又一个项目开源,阿里已成为中国开源的关键力量?
今天,开源软件托管平台github上的阿里巴巴主页又增加了一个新项目:Atlas。在去年的云栖大会上,阿里巴巴资深技术专家倪生华宣布将于2017年初开源Atlas,现在这个承诺终于兑现了。Atlas项目的开源是否标志着阿里已成为中国开源的关键力量?请看本文的深度解读。
主动学习入门篇:如何能够显著地减少标注代价
在大数据和算力的助力下,深度学习掀起了一波浪潮,在许多领域取得了显著的成绩。以监督学习为主的深度学习方法,往往期望能够拥有大量的标注样本进行训练,模型能够学到更多有价值的知识(如下左图展示了3组常见的图像分类数据集,拥有上万的标注样本)。
Lindorm全文索引技术介绍
随着云原生、5G/IOT时代的到来,数据已经成为企业的重要资产,企业客户除了要求数据库能够“存得起”数据外,更加期望数据可以“看得见”,本文将介绍云原生多模数据库Lindorm的全文索引特性,基于Lucene构建倒排索引和列式存储,提供高效的多维查询、文本检索、统计分析能力,让数据更加可见。
可视化 DDoS 攻击地图
DDoS攻击通过分布式的源头针对在线服务发起的网络消耗或资源消耗的攻击,目的是使得目标无法正常提供服务。DDoS攻击主要针对一些重要的目标,从银行系统到新闻站点,而它之所以一直令人头疼在于如何在遭受攻击时仍然能够对用户提供正常服务。