AI+时代,谈谈产品经理对图像识别技术的阈值控制

本文涉及的产品
图像搜索,7款服务类型 1个月
简介:

AI+时代,谈谈产品经理对图像识别技术的阈值控制

产品满足用户的需求有一个阈值,产品值低于阈值用户会觉得了无生趣,即产品一般般,也即产品经理做了功能经理。产品值等于阈值产品功能基本满足了用户的需求,而只有产品经理驾驭了需求,把产品做成作品,产品值才有可能高于阈值,任何时候产品经理应该学习到高于需求阈值的产品方法论。AI+时代图片识别技术就是起点!

撰写本篇的目的:

当下每天看的到一个词:AI,满眼皆是AI的阶段,我们产品经理应该如何了解到AI的技术脉络和市场需求大势。AI不是新的概念,再次起来是因为有新的突破。

创新工场的李开复博士说现在是技术从业者创新的时代,那么我们产品经理究竟知道AI的哪些技术呢,本篇着重分析一下AI+时代的图像识别技术。

在AI领域之中,图像识别技术占据着极为重要的地位,而随着计算机技术与信息技术的不断发展,AI中的图像识别技术的应用范围不断扩展,如LineLian所见过的IBM的Watson医疗诊断、各种指纹识别、及常用的支付宝的面部识别以及百度地图中全景卫星云图识别等都属于这一应用的典型,AI这一技术已经应用于日常生活之中,图像识别技术将来定会有着较为广泛的运用,而为了保证AI中的图像识别技术能够较好地服务于AI+时代的几个重要产品领域,正是本篇就AI中的图像识别技术展开具体研讨的目的所在。

图像识别概况:

为了较好完成产品经理理解AI中的图像识别技术的本源,我们首先需要深入了解图像识别技术。作为智能领域的重要组成部分,图像识别的发展先后经历了文字识别、数字图像处理与识别、物体识别三个发展阶段,而在AI+时代的图像识别技术中,其本身所具备的功能早已超过了人类的极限,这也是AI的图像识别技术能够在各个垂直产品领域实现较好应用并几乎成为标配的原因所在。

最开始产品经理要明白图像识别技术本身的原理并不算太过复杂,信息的处理是这一技术的关键点所在,由于应用计算机实现的图像识别技术本身与人眼识别并不存在着本质的差别,这就使得图像识别技术同样需要根据自身对图像的记忆完成具体的识别工作。

在人类进行图像识别的过程中,人类的大脑会将图像的特征进行提取,并结合大脑中以往对各类图像的认知判断自身是否对图像存在过印象,这就是人们能够在观看一张图片后快速对其识别的原因所在。结合人类识别图像的原理,在计算机进行的图像识别中,计算机首先就能够完成图像分类并选出重要信息、排除冗余信息,根据这一分类计算机就能够结合自身记忆存储结合相关要求进行图像的识别,这一过程本身与人脑识别图像并不存在着本质差别。

对于图像识别技术来说,其本身提取出的图像特征直接关系着图像识别能否取得较为满意的结果。值得注意的是,由于计算机归根结底不同于人类的大脑,所以计算机提取出的图像特征存在着不稳定性,这种不稳定性往往会因为计算机提取图像特征的明显与普通影响图像识别的效率与准确性,由此可见图像特征对于AI中图像识别技术的重要意义。

图像识别分析:

对于当下AI+时代的图像识别技术来说,神经网络的图像识别技术与非线性降维的图像识别技术是最为常见的两种图像识别技术,LineLian将对两种常见的AI图像识别技术进行详细分析。

一、神经网络的图像识别技术

想要深入了解非线性降维的图像识别技术,我们就必须理解何为神经网络,这里的神经网络全称人工神经网络,其本身指的是在现代神经生物学研究基础上提出的模拟生物过程以反映人脑某些特性的计算结构,虽然我们使用了模拟这一名词,但事实上神经网络本身并没有完全模仿人类的神经网络,其本身只是通过对人类神经网络的抽象、简化和模拟实现相关计算结构效率的提升。

对于神经网络的图像识别技术来说,其能够实现图像的识别主要得益于神经网络学习算法的运用,而在应用神经网络进行的图像识别中,我们首先需要对相关图像进行预处理,这一预处理主要包括真彩色图像转换为灰度图、灰度图像的旋转与放大、灰度图像的归一化等内容。为了保证神经网络能够较好地实现图像识别,我们还需要针对图像识别的领域与对象完成具体的神经网络设计,这一设计主要包括以下五方面:

  • 输入层设计

  • 隐含层设计

  • 输出层设计

  • 初始权值的选取

  • 期望误差的选取

在输入层设计中,我们需要根据图像识别对象的需要确定求解的问题与数据表示方式,而在本篇进行的研究中,为了我们产品经理理解,LineLian将输入层统一设计为16×16图像样本尺寸缩放大小,256 维网络输入需要;而在隐含层的设计中,我们需要确定隐含层的数目与隐含层单元数的选择,当下业界已经确定了隐含层神经元数目的增加能够保证误差精度的降低,所以适当时候增加隐层数目就能够较好地完成神经网络的设计,而在隐含层单元数的选择中,我们可以参考经验公式 L=√M+N +a,L=log2N,这样就能够有效避免神经网络泛化能力较弱,对于训练外样本识别率降低的问题出现,公式中的 M 代表的是输出层神经元数目,而 N 则代表输入层神经元数目。

值得注意的是,通过删除那些影响较小的隐含层单元能够较好地提高神经网络的自身性能,但结构选定花费时间较长是这一方法的缺陷所在;在输出层的设计中,一般会选择多输出型作为神经网络的设计;而在初始权值的选取中,为了满足神经网络在学习过程中的较好收敛,初始权值一般选为(-1,1)之间的随机数;而在期望误差的选取中,其本身需要参考训练时间与预期误差值,这里LineLian选择 0.001 作为期望误差值。

在完成神经网络的设计后,我们还需要进行神经网络的训练才能够保证其较好的满足图像识别需求,为了保证这一设计的较好实现,LineLian选择在 MATLAB7.0 中使用函数 newff创建一个两层网络,这一网络包括 1 个输出神经元、16×16 个输入、26 个单元的隐含层,学习函数则选择了 learngdm,初始学习速率为 0.01 ~ 0.6、训练性能函数“mse”、训练指标 0.001、训练最大循环 2500。

在完成上述提到的神经网络设计与训练后,我们就可以着手对其进行应用实验,在这一实验中笔者应用这一神经网络对 26 个手写英文字母的图片进行了识别,下表 为这一识别的识别结果,结合该表我们能够发现,不同节点数目会直接影响神经网络图像识别的识别率,而 26 个隐含层节点数能够较好满足图像识别的需求,下图为隐含层为 26 时神经网络训练的误差性能曲线及训练时间。

结合这一结果我们可以断定,神经网络识别技术能够较好满足手写字母的识别,其本身在这一识别的过程中体现了准确、快速、较强抗干扰能力等特点,这些特点使得其本身能够凭借着学习算法较好地应用到更多复杂的图像识别中,更好地为我们垂直领域的产品提供服务。

AI+时代,谈谈产品经理对图像识别技术的阈值控制

AI+时代,谈谈产品经理对图像识别技术的阈值控制

二、非线性降维的图像识别技术

除了神经网络的图像识别技术外,非线性降维的图像识别技术也是当下AI时代较为常用的图像识别技术形式。对于传统应用计算机实现的图像识别技术来说,其本身属于较为高维的识别技术,这种高维特性使得计算机往往在图像识别的过程中承担着很多不必要的负担,这种负担自然会影响图像识别的速度与质量,非线性降维的图像识别技术就是能够较好实现图像识别降维的技术形式。

在非线性降维的图像识别技术出现前,业界最常采用的是线性降维的图像识别技术,这种技术本身具备着简单易于理解的优点,但在实际应用中人们发现,线性降维的图像识别技术存在着计算复杂度高且占用相对较多的时间和空间特性,也使得线性降维的图像识别技术不能够较好地满足各产品领域图像识别的需要。对于非线性降维的图像识别技术来说,其本身能够在不破坏图像结构的前提下实现其自身的降维这就使得图像识别技术的识别速度与精度能够实现较好的提升。

例如在人脸识别系统中,以往受图像维度较高的影响,人类识别系统往往需要耗费大量的时间,计算机系统也往往会受到较大的“摧残”,这主要是由于人脸在高纬度空间中存在的分布不均匀特性所致,而在应用非线性降维的图像识别技术后,人脸图形就能够较好地实现自身的紧凑,这就使得人脸识别系统的工作效率大大提升,总的来说非线性降维的图像识别技术能够较好地为图像识

别提供辅助,上文中LineLian提到的神经网络的图像识别技术,也能够在非线性降维的图像识别技术的支持下更好地完成自身工作。

图像识别技术的对产品领域的应用

随着智能网络中的AI技术不断发展,其本身将在产品数据安全、AI+医疗产品、AI+直播产品、AI+社交产品等垂直领域产生重要的产品应用。

之前人机围棋大战,最终人类顶尖棋手李世石以 1:4 不敌 Google 出品的人工智能 AlphaGo。其核心原理采用了多层神经网络对图像进行分析,同时运用深度学习算法总结规律,最终得出战胜人类高手的棋招。

图像鉴别,10000 个场控都干不来互联网的开放不仅带来了自由,同样也成为垃圾信息的温床。最为人熟知的一个职位叫做“鉴黄师”,代表人物自然是“唐马儒”,但实际上“唐马儒”再多也满足不了现在对于图像鉴别和挖掘的需求。最好的例子就是前不久爆出的“直播造人”,视频和直播类内容的兴起使得对内容的鉴定需求呈几何倍数增长。

直播对于审核的实时性要求太高,同时在线的直播数量大,一不小心违规的东西就上线了。传统的解决方案是通过人力完成,所需要的人数会与主播成一个比例。通常都是好几百人坐在屏幕前面持续对闪过的画面进行筛选,如果发现不符合规定就进行人工处理。而AI+时代的产品趣向是利用AI图像识别技术。

另外在公共安全领域中,人脸识别产品的应用就能够较好的提高市场社会的安全性与便利性;而在医学领域中,心电图与 B 超的识别将大大促进用户医疗事业的便捷;而在农业领域中,种子识别科技产品与食品品质检测科技产品的应用将大大提高农产品的生产质量,例如我家种了几十亩葡萄 葡萄需要剪枝 修果 摘叶需要很多的劳动力, 感觉很多环节可以通过图像识别的机器来处理,粒径不同的果粒,大小不一的叶片,高度不同的枝条,我总觉得可以通过图像对比来区分,筛选,这样的AI图像识别机器人才是刚性需求。

在日常生活中图像识别技术在冰箱中的运用将大大提高用户生活的便利性,这一应用能够实现自动冰箱食品列表生成、食品保鲜状态的显示、食物最佳储存温度的判断等功能,这些将大大提高用户的生活品质。在未来科学技术的不断发展中,AI的图像识别技术还将实现更为长足的发展,而这一发展也将能够更好地接受图像识别技术产品所带来的服务,最终大大提高用户的生活质量。

作为一门科技含量较高的新兴技术,AI的图像识别技术已经与用户的生活紧密结合在一起,而为了保证其能够更好的为用户提供服务,对于科技网络从业紧密相关的产品技术人员就必须大力推进AI图像识别技术产品的不断学习与创新,这对于我们产品经理未来创造的很多产品息息相关并将提高产品效率和切中用户对产品的刚性需求。

产品思维是抓住机遇,需求一旦过气了或者被竞争对手超越了产品想胜出是是十分困难的,只能跟随市场的步伐去追市场的需求而迭代。而AI+时代的产品经理应该有的思维模式是作品思维,不仅仅是追随需求,更多的是锤炼过滤并真金不怕火炼般的引领需求的潮流。

雷锋网(公众号:雷锋网)按:本文由 @连诗路 前阿里产品专家原创发布于人人都是产品经理。未经许可,禁止转载。


本文作者:人人都是产品经理
本文转自雷锋网禁止二次转载, 原文链接

相关文章
|
6天前
|
人工智能 搜索推荐 安全
AI技术在医疗领域的应用与挑战
【10月更文挑战第27天】 本文探讨了人工智能(AI)在医疗领域的应用,包括疾病诊断、药物研发和患者管理等方面。同时,也分析了AI在医疗领域面临的挑战,如数据隐私、伦理问题和技术局限性等。通过对这些方面的深入分析,我们可以更好地理解AI在医疗领域的潜力和发展方向。
104 59
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
思通数科AI平台在尽职调查中的技术解析与应用
思通数科AI多模态能力平台结合OCR、NLP和深度学习技术,为IPO尽职调查、融资等重要交易环节提供智能化解决方案。平台自动识别、提取并分类海量文档,实现高效数据核验与合规性检查,显著提升审查速度和精准度,同时保障敏感信息管理和数据安全。
37 11
|
4天前
|
机器学习/深度学习 人工智能 算法
AI技术在医疗健康领域的应用与挑战####
本文旨在探讨人工智能(AI)技术在医疗健康领域的创新应用及其面临的主要挑战。通过深入分析AI如何助力疾病诊断、治疗方案优化、患者管理及药物研发,本文揭示了AI技术在提升医疗服务质量、效率和可及性方面的巨大潜力。同时,文章也指出了数据隐私、伦理道德、技术局限性等关键问题,并提出了相应的解决策略和未来发展方向。本文为医疗从业者、研究者及政策制定者提供了对AI医疗技术的全面理解,促进了跨学科合作与创新。 ####
|
2天前
|
人工智能 算法
AI技术在医疗领域的应用及其挑战
【10月更文挑战第31天】本文将探讨AI技术在医疗领域的应用及其面临的挑战。我们将从AI技术的基本概念开始,然后详细介绍其在医疗领域的应用,包括疾病诊断、药物研发、患者护理等方面。最后,我们将讨论AI技术在医疗领域面临的挑战,如数据隐私、算法偏见等问题。
|
2天前
|
存储 人工智能 文字识别
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
本文介绍了纸质档案数字化的技术流程,包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取,以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术,提高图像质量,确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储,实现了高效、准确的档案数字化。具体应用案例显示,该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
医疗行业的语音识别技术解析:AI多模态能力平台的应用与架构
AI多模态能力平台通过语音识别技术,实现实时转录医患对话,自动生成结构化数据,提高医疗效率。平台具备强大的环境降噪、语音分离及自然语言处理能力,支持与医院系统无缝集成,广泛应用于门诊记录、多学科会诊和急诊场景,显著提升工作效率和数据准确性。
|
4天前
|
人工智能 运维 数据挖掘
跨界融合:AI与5G技术如何共同推动数字化转型
【10月更文挑战第29天】本文探讨了人工智能(AI)与第五代移动通信技术(5G)的结合如何推动数字化转型。通过高速、低延迟的5G网络和AI的数据分析能力,两者相辅相成,实现了智能化网络运维、增强网络功能和多行业的实际应用。文中提供了网络流量预测和故障预测的示例代码,展示了技术的实际应用潜力。
16 1
|
11天前
|
机器学习/深度学习 人工智能 供应链
AI技术在医疗领域的应用与未来展望###
本文深入探讨了人工智能(AI)技术在医疗领域的多种应用及其带来的革命性变化,从疾病诊断、治疗方案优化到患者管理等方面进行了详细阐述。通过具体案例和数据分析,展示了AI如何提高医疗服务效率、降低成本并改善患者体验。同时,文章也讨论了AI技术在医疗领域面临的挑战和未来发展趋势,为行业从业者和研究人员提供参考。 ###
|
11天前
|
机器学习/深度学习 人工智能 搜索推荐
人工智能与未来医疗:AI技术如何重塑医疗健康领域###
【10月更文挑战第21天】 一场由AI驱动的医疗革命正在悄然发生,它以前所未有的速度和深度改变着我们对于疾病预防、诊断、治疗及健康管理的认知。本文探讨了AI在医疗领域的多维度应用,包括精准医疗、药物研发加速、远程医疗普及以及患者个性化治疗体验的提升,揭示了这场技术变革背后的深远意义与挑战。 ###
41 6
|
11天前
|
机器学习/深度学习 人工智能 算法
AI技术在医疗领域的应用与挑战
【10月更文挑战第21天】 本文探讨了人工智能(AI)在医疗领域的多种应用,包括疾病诊断、治疗方案推荐、药物研发和患者管理等。通过分析这些应用案例,我们可以看到AI技术如何提高医疗服务的效率和准确性。然而,AI在医疗领域的广泛应用也面临诸多挑战,如数据隐私保护、算法透明度和伦理问题。本文旨在为读者提供一个全面的视角,了解AI技术在医疗领域的潜力和面临的困难。