【沙龙实况】图像的秘密·开发者沙龙

简介:

提起图像识别,你想到什么?本周六下午两点,雷锋网(公众号:雷锋网)联手汉王云主办的《图像的秘密·图像识别开发者沙龙》在中关村贝塔咖啡热烈上演。

来自汉王云的首席架构师虞文明、海康萤石的产品经理孙杰、云视智通郭春雪、骏聿科技刘海林、WRTnode罗未、美咖相机的毛明杰,以及汉王的人脸识别大咖黄磊博士分别在沙龙上做了分享。这其中有前沿技术研究的专家,面向开发者的底层技术服务,也有前端应用,有平台有硬件。

以下是沙龙上与会嘉宾的主题分享:

汉王云:让识别触手可及

汉王云的首席架构师虞文明首先介绍了汉王多年的一些识别技术,比如手写识别、OCR识别、人脸识别等。在过去十多年里,汉王在模式识别的技术上有深厚的积累,推出了层出不穷的软硬件产品,开创了宏大的识别硬件市场,给人们带来了方便。如今汉王云将这些成熟的识别技术逐渐以云服务API的方式提供给开发者。通过汉王云,开发者可以进行名片,手写,数学公式,拍照题目,纯文本,票据,文字表格,人脸定位,人脸年龄,人脸表情,人脸性别的多种识别。汉王云针对个人开发者和小微企业的移动终端访问提供免费服务。

随后,汉王云的胡云辉同学针对开放平台演示了如何快速调用汉王模式识别的API。嗯,这位85后的技术哥业务是相当熟练,讲解飞快,识别效果亦是立竿见影。

【沙龙实况】图像的秘密·开发者沙龙

随后在现场积极的互动中,虞总也向开发者们详细介绍了汉王云和汉王识别技术的一些特点:比如开发者们可以基于现成的手写识别(单字识别、行识别)开发游戏;而相比一些同样深耕于OCR识别的技术公司,汉王的主要优势是专精于汉字的识别;在识别效果上,由于OCR识别对输入图片有较高的要求,汉王会通过多种SDK辅助处理的方式来改善图片质量,在识别效果上汉王也会配合开发者一起获取更好的识别效果。

OCR之外,现场亦有开发者十分关心汉王的人脸识别技术。对此汉王的人脸识别专家黄磊博士告诉我们,目前国际上人脸识别较大的难点在用户不同姿态和光照条件下的识别,所以对一些精度要求非常高的情境(比如公安领域的黑名单比对),国际上还没有非常完善的解决方案。而汉王在人脸上的突破主要在两方面:

第一,黄博士带领的团队做了国际上第一款红外人脸识别系统;
其次是汉王同样在主力研发一些针对精度要求并不那么高,但应用广泛的领域,比如娱乐业、比如智能电视等等。

虞总表示,汉王云的开发者服务目前针对小微企业和个人开发者免费。待这些公司的业务发展到一定阶段后,还可以可以展开更加灵活的商业合作模式。

海康萤石:让商户更好地了解顾客

海康萤石做的是,通过基于图像的商户客流识别技术,来帮助大型商场更好地了解顾客。比如,通过空间热度图得到某个区域的客流数据和分布,商户可借此优化商品布局等。另外,还可以识别顾客身份、识别场景中的运动目标进行防盗等。

【沙龙实况】图像的秘密·开发者沙龙

云视智通:炫酷的智能眼镜

下面是一位女程序猿上场啦,来自云视智通的郭春雪。看,她一上台就开始调侃自己:你们大家看到我没有穿高跟鞋、没有化妆,就知道我是一名女程序猿了。哈哈,为了讲解未来智能眼镜的应用场景,她居然还借用了天猫的广告语——在未来,所见即所得。哼,这样也行?

【沙龙实况】图像的秘密·开发者沙龙

WRTnode:没有交互才是最好的交互

罗未是雷锋网的老朋友了,我们以前举办路由器、OpenWRT等锋会现场都有他的影子。他们会提供从硬件到开发环境的服务,希望在这些领域做一个基础设备提供商。罗未还展示了他们“天生骄傲”的开发板,同时也不忘装一下情怀:“你们能看到我的头发很长,所以能体会到我是很有情怀的人,同时我又非常的人文,还会敲代码,所以是走在科技与人文的十字路口。”

【沙龙实况】图像的秘密·开发者沙龙

美咖相机:让照“骗”飞

现今各种美颜相机的出现,导致妹子的自拍图“掺假”严重,广大男同胞也因此练就了火眼金睛,轻而易举就能看出哪个是美化过的。怎么办呢,美咖相机就基于人脸识别技术实现了看起来不那么假的美化效果。

毛明杰说,大多滤镜美化经常会把背景也处理了,比如使用瘦脸功能时,如果背景有一个墙角,那么瘦脸的同时也会把墙壁拉歪,看起来非常不真实。而依靠人脸识别技术就能限定好五官轮廓的位置,只美化关键部位,这样不会被人察觉。肿么样,妹子们喜欢吗?

【沙龙实况】图像的秘密·开发者沙龙

 
 
 
 
  本文作者: 白腾飞

本文转自雷锋网禁止二次转载, 原文链接
目录
相关文章
|
数据采集 机器学习/深度学习 人工智能
中文竞技场大模型测评-龙虎榜
本次测评选取写作创作相关、代码相关、知识常识、中文游戏、人类价值观、NLP专业领域6大场景和20个细分维度,分别对通义Qwen-Chat-7B、凤凰Phoenix-7B、ChatGLM2-6B、moss-moon-003-sft等大模型进行了超过 200+ 道题的评测。测评旨在为大家提供有关这些模型在不同领域和维度上的表现,更好地选择适合自己需求的模型和应用,期待这次测评能够为AI模型领域的学习和研究提供有价值的参考和指导。
70376 5
|
9月前
|
机器学习/深度学习 人工智能 文字识别
从“泛读”到“精读”:合合信息文档解析如何让大模型更懂复杂文档?
随着deepseek等大模型逐渐步入视野,理论上文档解析工作应能大幅简化。 然而,实际情况却不尽如人意。当前的多模态大模型虽然具备强大的视觉与语言交互能力,但在解析非结构化文档时,仍面临复杂版式、多元素混排以及严密逻辑推理等挑战。
358 0
|
10月前
|
传感器 监控 大数据
指挥学校大数据系统解决方案
本系统集成九大核心平台,包括中心化指挥、数据处理、学生信息、反校园欺凌大数据、智慧课堂、学生行为综合、数据交换及其他外部系统云平台。通过这些平台,系统实现对学生行为、课堂表现、校园安全等多维度的实时监控与数据分析,为教育管理、执法机关、心理辅导等提供强有力的数据支持。特别地,反校园欺凌平台利用多种传感器和智能设备,确保及时发现并处理校园霸凌事件,保障学生权益。同时,系统还涵盖超市、食堂、图书馆、消防安全等辅助云平台,全面提升校园智能化管理水平。
|
12月前
|
Java Maven Spring
SpringBoot配置跨模块扫描问题解决方案
在分布式项目中,使用Maven进行多模块开发时,某些模块(如xxx-common)没有启动类。如何将这些模块中的类注册为Spring管理的Bean对象?本文通过案例分析,介绍了两种解决方案:常规方案是通过`@SpringBootApplication(scanBasePackages)`指定扫描路径;推荐方案是保持各模块包结构一致(如com.xxx),利用SpringBoot默认扫描规则自动识别其他模块中的组件,简化配置。
1464 1
SpringBoot配置跨模块扫描问题解决方案
|
10月前
|
算法 API 数据格式
PromptScope: 一个灵活高效的In-Context Training框架
PromptScope: 一个灵活高效的In-Context Training框架
222 3
|
10月前
|
算法 关系型数据库 MySQL
join查询可以⽆限叠加吗?MySQL对join查询有什么限制吗?
大家好,我是 V 哥。本文详细探讨了 MySQL 中 `JOIN` 查询的限制及其优化方法。首先,`JOIN` 查询不能无限叠加,存在资源(CPU、内存、磁盘 I/O)、性能和语法等方面的限制。过多的 `JOIN` 操作会导致数据库性能急剧下降。其次,介绍了三种常见的 `JOIN` 查询算法:嵌套循环连接(NLJ)、索引嵌套连接(INL)和基于块的嵌套循环连接(BNL),并分析了它们的触发条件和性能特点。最后,分享了优化 `JOIN` 查询的方法,包括 SQL 语句优化、索引优化、数据库配置调整等。关注 V 哥,了解更多技术干货,点赞👍支持,一起进步!
261 3
|
机器学习/深度学习 自然语言处理 前端开发
前端神经网络入门:Brain.js - 详细介绍和对比不同的实现 - CNN、RNN、DNN、FFNN -无需准备环境打开浏览器即可测试运行-支持WebGPU加速
本文介绍了如何使用 JavaScript 神经网络库 **Brain.js** 实现不同类型的神经网络,包括前馈神经网络(FFNN)、深度神经网络(DNN)和循环神经网络(RNN)。通过简单的示例和代码,帮助前端开发者快速入门并理解神经网络的基本概念。文章还对比了各类神经网络的特点和适用场景,并简要介绍了卷积神经网络(CNN)的替代方案。
1779 1
|
安全 5G SDN
5G 网络切片:为万物互联定制专属网络
5G 网络切片:为万物互联定制专属网络
787 1
|
小程序 开发者
uniapp 获取微信的 openid(借助 uniCloud)
uniapp 获取微信的 openid(借助 uniCloud)
1616 0