计算机视觉(computer vision),顾名思义,是分析、研究让计算机智能化的达到类似人类的双眼“看”的一门研究科学。即对于客观存在的三维立体化的世界的理解以及识别依靠智能化的计算机去实现。确切地说,计算机视觉技术就是利用了摄像机以及电脑替代人眼使得计算机拥有人类的双眼所具有的分割、分类、识别、跟踪、判别决策等功能。总之,计算机视觉系统就是创建了能够在2D的平面图像或者3D的三维立体图像的数据中,以获取所需要的“信息”的一个完整的人工智能系统。
计算机视觉技术是一门包括了计算机科学与工程、神经生理学、物理学、信号处理、认知科学、应用数学与统计等多门科学学科的综合性科学技术。由于计算机视觉技术系统在基于高性能的计算机的基础上,其能够快速的获取大量的数据信息并且基于智能算法能够快速的进行处理信息,也易于同设计信息和加工控制信息集成。
计算机视觉本身包括了诸多不同的研究方向,比较基础和热门的方向包括:物体识别和检测(Object Detection),语义分割(Semantic Segmentation),运动和跟踪(Motion & Tracking),视觉问答(Visual Question & Answering)等。
2020年1月底,阿里云正式推出以计算机视觉AI能力为核心的视觉智能开放平台(vision.aliyun.com),平台目前已上线8大类目,超过50多种视觉AI能力,面向人脸识别,文字识别,商品理解,内容安全,图像识别,图像增强,目标检测等多个视觉应用核心场景。所有视觉AI能力都以API方式进行开放,最大程度降低开发者接入成本。
阿里云视觉智能平台上所有AI能力均来自阿里巴巴经济体,包括达摩院、阿里云、支付宝、菜鸟、天猫等事业部,其中包含了深度学习、图像识别、OCR,图计算等方面的最新前沿研究成果,并且所有AI能力都经过了阿里经济体的具体应用与实践,确保各能力符合场景实际需求。
查看更多:https://yqh.aliyun.com/detail/6867?utm_content=g_1000106912
图片分辨率:输入图片尺寸不得超过5000*5000像素。