AI+时代，谈谈产品经理对图像识别技术的阈值控制-阿里云开发者社区

AI+时代，谈谈产品经理对图像识别技术的阈值控制

产品满足用户的需求有一个阈值，产品值低于阈值用户会觉得了无生趣，即产品一般般，也即产品经理做了功能经理。产品值等于阈值产品功能基本满足了用户的需求，而只有产品经理驾驭了需求，把产品做成作品，产品值才有可能高于阈值，任何时候产品经理应该学习到高于需求阈值的产品方法论。AI+时代图片识别技术就是起点！

撰写本篇的目的：

当下每天看的到一个词：AI，满眼皆是AI的阶段，我们产品经理应该如何了解到AI的技术脉络和市场需求大势。AI不是新的概念，再次起来是因为有新的突破。

创新工场的李开复博士说现在是技术从业者创新的时代，那么我们产品经理究竟知道AI的哪些技术呢，本篇着重分析一下AI+时代的图像识别技术。

在AI领域之中，图像识别技术占据着极为重要的地位，而随着计算机技术与信息技术的不断发展，AI中的图像识别技术的应用范围不断扩展，如LineLian所见过的IBM的Watson医疗诊断、各种指纹识别、及常用的支付宝的面部识别以及百度地图中全景卫星云图识别等都属于这一应用的典型，AI这一技术已经应用于日常生活之中，图像识别技术将来定会有着较为广泛的运用，而为了保证AI中的图像识别技术能够较好地服务于AI+时代的几个重要产品领域，正是本篇就AI中的图像识别技术展开具体研讨的目的所在。

图像识别概况：

为了较好完成产品经理理解AI中的图像识别技术的本源，我们首先需要深入了解图像识别技术。作为智能领域的重要组成部分，图像识别的发展先后经历了文字识别、数字图像处理与识别、物体识别三个发展阶段，而在AI+时代的图像识别技术中，其本身所具备的功能早已超过了人类的极限，这也是AI的图像识别技术能够在各个垂直产品领域实现较好应用并几乎成为标配的原因所在。

最开始产品经理要明白图像识别技术本身的原理并不算太过复杂，信息的处理是这一技术的关键点所在，由于应用计算机实现的图像识别技术本身与人眼识别并不存在着本质的差别，这就使得图像识别技术同样需要根据自身对图像的记忆完成具体的识别工作。

在人类进行图像识别的过程中，人类的大脑会将图像的特征进行提取，并结合大脑中以往对各类图像的认知判断自身是否对图像存在过印象，这就是人们能够在观看一张图片后快速对其识别的原因所在。结合人类识别图像的原理，在计算机进行的图像识别中，计算机首先就能够完成图像分类并选出重要信息、排除冗余信息，根据这一分类计算机就能够结合自身记忆存储结合相关要求进行图像的识别，这一过程本身与人脑识别图像并不存在着本质差别。

对于图像识别技术来说，其本身提取出的图像特征直接关系着图像识别能否取得较为满意的结果。值得注意的是，由于计算机归根结底不同于人类的大脑，所以计算机提取出的图像特征存在着不稳定性，这种不稳定性往往会因为计算机提取图像特征的明显与普通影响图像识别的效率与准确性，由此可见图像特征对于AI中图像识别技术的重要意义。

图像识别分析：

对于当下AI+时代的图像识别技术来说，神经网络的图像识别技术与非线性降维的图像识别技术是最为常见的两种图像识别技术，LineLian将对两种常见的AI图像识别技术进行详细分析。

一、神经网络的图像识别技术

想要深入了解非线性降维的图像识别技术，我们就必须理解何为神经网络，这里的神经网络全称人工神经网络，其本身指的是在现代神经生物学研究基础上提出的模拟生物过程以反映人脑某些特性的计算结构，虽然我们使用了模拟这一名词，但事实上神经网络本身并没有完全模仿人类的神经网络，其本身只是通过对人类神经网络的抽象、简化和模拟实现相关计算结构效率的提升。

对于神经网络的图像识别技术来说，其能够实现图像的识别主要得益于神经网络学习算法的运用，而在应用神经网络进行的图像识别中，我们首先需要对相关图像进行预处理，这一预处理主要包括真彩色图像转换为灰度图、灰度图像的旋转与放大、灰度图像的归一化等内容。为了保证神经网络能够较好地实现图像识别，我们还需要针对图像识别的领域与对象完成具体的神经网络设计，这一设计主要包括以下五方面：

输入层设计
隐含层设计
输出层设计
初始权值的选取
期望误差的选取

在输入层设计中，我们需要根据图像识别对象的需要确定求解的问题与数据表示方式，而在本篇进行的研究中，为了我们产品经理理解，LineLian将输入层统一设计为16×16图像样本尺寸缩放大小，256 维网络输入需要；而在隐含层的设计中，我们需要确定隐含层的数目与隐含层单元数的选择，当下业界已经确定了隐含层神经元数目的增加能够保证误差精度的降低，所以适当时候增加隐层数目就能够较好地完成神经网络的设计，而在隐含层单元数的选择中，我们可以参考经验公式 L=√M+N +a,L=log2N，这样就能够有效避免神经网络泛化能力较弱，对于训练外样本识别率降低的问题出现，公式中的 M 代表的是输出层神经元数目，而 N 则代表输入层神经元数目。

值得注意的是，通过删除那些影响较小的隐含层单元能够较好地提高神经网络的自身性能，但结构选定花费时间较长是这一方法的缺陷所在；在输出层的设计中，一般会选择多输出型作为神经网络的设计；而在初始权值的选取中，为了满足神经网络在学习过程中的较好收敛，初始权值一般选为（-1,1）之间的随机数；而在期望误差的选取中，其本身需要参考训练时间与预期误差值，这里LineLian选择 0.001 作为期望误差值。

在完成神经网络的设计后，我们还需要进行神经网络的训练才能够保证其较好的满足图像识别需求，为了保证这一设计的较好实现，LineLian选择在 MATLAB7.0 中使用函数 newff创建一个两层网络，这一网络包括 1 个输出神经元、16×16 个输入、26 个单元的隐含层，学习函数则选择了 learngdm，初始学习速率为 0.01 ～ 0.6、训练性能函数“mse”、训练指标 0.001、训练最大循环 2500。

在完成上述提到的神经网络设计与训练后，我们就可以着手对其进行应用实验，在这一实验中笔者应用这一神经网络对 26 个手写英文字母的图片进行了识别，下表为这一识别的识别结果，结合该表我们能够发现，不同节点数目会直接影响神经网络图像识别的识别率，而 26 个隐含层节点数能够较好满足图像识别的需求，下图为隐含层为 26 时神经网络训练的误差性能曲线及训练时间。

结合这一结果我们可以断定，神经网络识别技术能够较好满足手写字母的识别，其本身在这一识别的过程中体现了准确、快速、较强抗干扰能力等特点，这些特点使得其本身能够凭借着学习算法较好地应用到更多复杂的图像识别中，更好地为我们垂直领域的产品提供服务。

AI+时代，谈谈产品经理对图像识别技术的阈值控制

二、非线性降维的图像识别技术

除了神经网络的图像识别技术外，非线性降维的图像识别技术也是当下AI时代较为常用的图像识别技术形式。对于传统应用计算机实现的图像识别技术来说，其本身属于较为高维的识别技术，这种高维特性使得计算机往往在图像识别的过程中承担着很多不必要的负担，这种负担自然会影响图像识别的速度与质量，非线性降维的图像识别技术就是能够较好实现图像识别降维的技术形式。

在非线性降维的图像识别技术出现前，业界最常采用的是线性降维的图像识别技术，这种技术本身具备着简单易于理解的优点，但在实际应用中人们发现，线性降维的图像识别技术存在着计算复杂度高且占用相对较多的时间和空间特性，也使得线性降维的图像识别技术不能够较好地满足各产品领域图像识别的需要。对于非线性降维的图像识别技术来说，其本身能够在不破坏图像结构的前提下实现其自身的降维这就使得图像识别技术的识别速度与精度能够实现较好的提升。

例如在人脸识别系统中，以往受图像维度较高的影响，人类识别系统往往需要耗费大量的时间，计算机系统也往往会受到较大的“摧残”，这主要是由于人脸在高纬度空间中存在的分布不均匀特性所致，而在应用非线性降维的图像识别技术后，人脸图形就能够较好地实现自身的紧凑，这就使得人脸识别系统的工作效率大大提升，总的来说非线性降维的图像识别技术能够较好地为图像识

别提供辅助，上文中LineLian提到的神经网络的图像识别技术，也能够在非线性降维的图像识别技术的支持下更好地完成自身工作。

图像识别技术的对产品领域的应用

随着智能网络中的AI技术不断发展，其本身将在产品数据安全、AI+医疗产品、AI+直播产品、AI+社交产品等垂直领域产生重要的产品应用。

之前人机围棋大战，最终人类顶尖棋手李世石以 1:4 不敌 Google 出品的人工智能 AlphaGo。其核心原理采用了多层神经网络对图像进行分析，同时运用深度学习算法总结规律，最终得出战胜人类高手的棋招。

图像鉴别，10000 个场控都干不来互联网的开放不仅带来了自由，同样也成为垃圾信息的温床。最为人熟知的一个职位叫做“鉴黄师”，代表人物自然是“唐马儒”，但实际上“唐马儒”再多也满足不了现在对于图像鉴别和挖掘的需求。最好的例子就是前不久爆出的“直播造人”，视频和直播类内容的兴起使得对内容的鉴定需求呈几何倍数增长。

直播对于审核的实时性要求太高，同时在线的直播数量大，一不小心违规的东西就上线了。传统的解决方案是通过人力完成，所需要的人数会与主播成一个比例。通常都是好几百人坐在屏幕前面持续对闪过的画面进行筛选，如果发现不符合规定就进行人工处理。而AI+时代的产品趣向是利用AI图像识别技术。

另外在公共安全领域中，人脸识别产品的应用就能够较好的提高市场社会的安全性与便利性；而在医学领域中，心电图与 B 超的识别将大大促进用户医疗事业的便捷；而在农业领域中，种子识别科技产品与食品品质检测科技产品的应用将大大提高农产品的生产质量，例如我家种了几十亩葡萄葡萄需要剪枝修果摘叶需要很多的劳动力，感觉很多环节可以通过图像识别的机器来处理，粒径不同的果粒，大小不一的叶片，高度不同的枝条，我总觉得可以通过图像对比来区分，筛选，这样的AI图像识别机器人才是刚性需求。

在日常生活中图像识别技术在冰箱中的运用将大大提高用户生活的便利性，这一应用能够实现自动冰箱食品列表生成、食品保鲜状态的显示、食物最佳储存温度的判断等功能，这些将大大提高用户的生活品质。在未来科学技术的不断发展中，AI的图像识别技术还将实现更为长足的发展，而这一发展也将能够更好地接受图像识别技术产品所带来的服务，最终大大提高用户的生活质量。

作为一门科技含量较高的新兴技术，AI的图像识别技术已经与用户的生活紧密结合在一起，而为了保证其能够更好的为用户提供服务，对于科技网络从业紧密相关的产品技术人员就必须大力推进AI图像识别技术产品的不断学习与创新，这对于我们产品经理未来创造的很多产品息息相关并将提高产品效率和切中用户对产品的刚性需求。

产品思维是抓住机遇，需求一旦过气了或者被竞争对手超越了产品想胜出是是十分困难的，只能跟随市场的步伐去追市场的需求而迭代。而AI+时代的产品经理应该有的思维模式是作品思维，不仅仅是追随需求，更多的是锤炼过滤并真金不怕火炼般的引领需求的潮流。

雷锋网(公众号：雷锋网)按：本文由 @连诗路前阿里产品专家原创发布于人人都是产品经理。未经许可，禁止转载。

本文作者：人人都是产品经理

本文转自雷锋网禁止二次转载，原文链接

AI+时代，谈谈产品经理对图像识别技术的阈值控制

撰写本篇的目的：

图像识别概况：

图像识别分析：

二、非线性降维的图像识别技术

图像识别技术的对产品领域的应用

雷锋网

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

AI+时代，谈谈产品经理对图像识别技术的阈值控制

撰写本篇的目的：

图像识别概况：

图像识别分析：

二、非线性降维的图像识别技术

图像识别技术的对产品领域的应用

雷锋网

热门文章

最新文章

相关课程

相关电子书

相关实验场景