阿里云的人工智能是如何实战的?

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 如何利用大数据创造商业价值?阿里云在人工智能领域做了哪些创新和实践?如何利用大数据为机场管理保驾护航? 11月15日晚,阿里云数据科学家闫新发(算者)在华南理工大学举行的广东航空大数据创新大赛专场技术讲座现场给学子们做了一场精彩分享——《阿里云人工智能实战案例及技术能力》,现场座无虚席,气氛热烈。

如何利用大数据创造商业价值?阿里云在人工智能领域做了哪些创新和实践?如何利用大数据为机场管理保驾护航?

11月15日晚,阿里云数据科学家闫新发(算者)在华南理工大学举行的广东航空大数据创新大赛专场技术讲座现场给学子们做了一场精彩分享——《阿里云人工智能实战案例及技术能力》,现场座无虚席,气氛热烈。

ET_

闫新发,花名算者,人如其名:在2013-2015年期间,个人几乎包揽了阿里巴巴集团内部大数据竞赛的所有冠军;2015年带领团队在世界推荐算法比赛 (ACM RecSys Challenge,算法领域的世锦赛)取得第二名的成绩,2016年该团队在该比赛获得世界第一名。

大数据+算法

在阿里巴巴集团,算法创造了什么价值?

作巨额交易背后,阿里不仅提供商品,依靠推荐系统,更做到了基于个性推荐的千人前面:首页个性化,上亿用户和十余亿商品之间的精准匹配,提供差异化的服务,犹如消费者进入商场的差那就已经被传送到不同的楼层;店铺个性化犹如进入了商场的某个店面,其中不管是商品摆放还是风格都是根据用户的喜好定制。

ET_

最简单的例子就是女性用户和男性用户来到同一家淘宝店铺看到的是不一样的店铺承接页,女性看到是可爱的粉色页面,是女装,男生看到的可能是庄重的黑色页面和男装,这就好比每个人进了一家线下店看到的都是不一样的装修风格和不同的商品陈列,从而让用户产生更多的共鸣,有了更好的购物心情。

千人千面在有效提高转化率的同时也为用户提供了更愉悦的体验。正如马老师所说:“今天的成绩已经很满意了!双11已经不是数字上看销售额是多少,我们最希望双11给所有的买家和卖家带来快乐,快乐是我们最希望能够量化的东西。”

电商之外,大数据在基础产业亦发挥作用。比如在新能源领域,对风力进行预测,解决风力和火力的均衡问题,实现电网并网负载的均衡;在农业、林业领域,通过图像识别进行病虫害检测、产量预测等。与此同时,即便是日常生活中,算法亦无处不在,就比如旅游中常常购买特价机票,实际上是预测了未来三天的低价,再以未来某一天的低价的轻微上浮在当前进行出售。

ET_

在云计算领域,借助阿里云孵化器这一平台,大数据已改变许多行业,比如针对行业通用问题,建构企业图谱,让企业有谱,让舆情可控;在传统零售业预测销量;针对创业类公司,利用调度算法创新其商业模式;利用技术服务客户,利用云计算平台进行3D建模,提高效率;在传统工业通过算法优化提高工艺良品率。

从科技到普惠

“人工智能是基础,行业才是成为数据科学家的关键。”这是阿里云人工智能首席科学家、小Ai之父闵万里博士在内部常说的一句话。

ET_

▲阿里云大数据孵化器团队首席数据科学家闵万里(山景)博士▲

阿里巴巴从来就不仅是一家科技公司。计算,一定要成为普惠科技,成为各行各业能够简单获取的能力,才能不断去创造“无法计算的价值”。通过算者的详尽介绍可以发现,过去我们对大数据的研究多侧重于理念、发展未来、研究性产品,现在的重点更在于大数据的落地,阿里云致力于将它的能力赋能给各个行业,在各个产业落地。

而在这里,就不得不提阿里云的一支神秘“特种部队”——阿里云大数据孵化器。这是一群由科学家组成的团队,通过利用阿里云强大的计算平台加上顶级专业的算法与行业数据有机的融合,正在积极探索人工智能在各行业中的应用,不断的挖掘数据的价值,实现用数据驱动行业创新,用数据提升业务效率。

新生代成长

分享过程中,算者对同学们提出期待:借助阿里云天池平台提供的丰富资源,希望学生拓宽眼界,除了学好理论知识,做好研究之外,还要多看看外面的世界,思考大数据有可能在哪些行业落地,自己将来会进入哪个行业,如何将对技术的热爱与职业发展相结合。埋头看书的同时也要抬头看路。

而借助阿里云基于海量数据处理服务MaxCompute搭建的天池大数据平台(tianchi.aliyun.com),向社会提供科研数据和开放数据处理服务,旨在打造“数据众智、众创”第一平台,目前,天池平台拥有5万名高质量数据人才,是最大的数据爱好者社区。天池大数据竞赛是基于天池平台开展的数据类竞赛活动,包括算法大赛、可视化大赛和程序设计大赛等多种形式的竞赛,向社会提供科研和实际产业的数据,大赛让所有参与者有机会运用其设计的算法解决各类社会生活问题和商业世界中的实际问题。

ET_

正如此次2016“数据引领飞粤云端”广东航空大数据创新大赛,在广东省政府和阿里巴巴集团的有力推动下,联合广东省经信委、惠州市人民政府、阿里云、广州机场白云科技有限公司共同举办,首次开放航空数据,不仅是一场比赛,更进一步是培养大数据应用人才,鼓励数据创新创业实践,推动民航业大数据技术成果转化和落地。

(大)数据+(高级)算法=(小)目标

回到问题的原点,是不忘初心。大数据的“初心”是明确其目标,再去思考所需的数据和算法。目标的优化能带来方法的改进和效率的提升。比如人工智能阿尔法狗下围棋,待解决问题是如何做决策,落哪一个棋子是最优选择,解决方法是通过不断强化学习,而这整个过程都是围绕赢得博弈这个目标进行的。在我们日常生活中、各行各业的运行中有各种各样的目标,这些目标有大有小,有宏观为微观,大到如何让出行更顺畅,小到如何通过图像识别技术自动识别几百万公里线缆上的某一处是否有厘米级的破损,让我们一起探索用大数据来实现它。

ET_

正如马老师在2015年云栖大会的主题演讲中所总结的那样:中国一定会成为一个计算大国,因为未来的数据是一种生产资料,而未来的生产力就是计算能力和在座的所有创业者的创新能力,企业家精神。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
14天前
|
人工智能 JSON 自然语言处理
基于阿里云通义千问的AI模型应用开发指南
阿里云通义千问是阿里巴巴集团推出的多模态大语言模型平台,提供了丰富的API和接口,支持多种AI应用场景,如文本生成、图像生成和对话交互等。本文将详细介绍阿里云通义千问的产品功能,并展示如何使用其API来构建一个简单的AI应用,包括程序代码和具体操作流程,以帮助开发者快速上手。
166 3
|
3天前
|
人工智能 JSON API
阿里云文档智能 & RAG解决方案:提升AI大模型业务理解与应用
阿里云推出的文档智能 & RAG解决方案,旨在通过先进的文档解析技术和检索增强生成(RAG)方法,显著提升人工智能大模型在业务场景中的应用效果。该方案通过文档智能(Document Mind)技术将非结构化文档内容转换为结构化数据,提取文档的层级树、样式和版面信息,并输出为Markdown和Json格式,为RAG提供语义分块策略。这一过程不仅解决了文档内容解析错误和切块丢失语义信息的问题,还优化了输出LLM友好的Markdown信息。方案的优势在于其多格式支持能力,能够处理包括Office文档、PDF、Html、图片在内的主流文件类型,返回文档的样式、版面信息和层级树结构。
24 2
|
12天前
|
存储 人工智能 分布式计算
Parquet 文件格式详解与实战 | AI应用开发
Parquet 是一种列式存储文件格式,专为大规模数据处理设计,广泛应用于 Hadoop 生态系统及其他大数据平台。本文介绍 Parquet 的特点和作用,并演示如何在 Python 中使用 Pandas 库生成和读取 Parquet 文件,包括环境准备、生成和读取文件的具体步骤。【10月更文挑战第13天】
137 60
|
10天前
|
存储 人工智能 自然语言处理
Elasticsearch Inference API增加对阿里云AI的支持
本文将介绍如何在 Elasticsearch 中设置和使用阿里云的文本生成、重排序、稀疏向量和稠密向量服务,提升搜索相关性。
54 14
Elasticsearch Inference API增加对阿里云AI的支持
|
7天前
|
存储 人工智能 数据可视化
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
在数字化时代,企业面临海量客户对话数据处理的挑战。阿里云推出的“AI大模型助力客户对话分析”解决方案,通过先进的AI技术和智能化分析,帮助企业精准识别客户意图、发现服务质量问题,并生成详尽的分析报告和可视化数据。该方案采用按需付费模式,有效降低企业运营成本,提升客服质量和销售转化率。
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
|
3天前
|
人工智能 Cloud Native 数据管理
媒体声音|重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
在2024云栖大会上,阿里云瑶池数据库发布了首个一站式多模数据管理平台DMS:OneMeta+OneOps。该平台由Data+AI驱动,兼容40余种数据源,实现跨云数据库、数据仓库、数据湖的统一数据治理,帮助用户高效提取和分析元数据,提升业务决策效率10倍。DMS已服务超10万企业客户,降低数据管理成本高达90%。
|
3天前
|
存储 人工智能 调度
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
5天前
|
存储 人工智能 弹性计算
对话阿里云吴结生:AI时代,云上高性能计算的创新发展
在阿里云智能集团副总裁,弹性计算产品线负责人、存储产品线负责人 吴结生看来,如今已经有很多行业应用了高性能计算,且高性能计算的负载正呈现出多样化发展的趋势,“当下,很多基础模型的预训练、自动驾驶、生命科学,以及工业制造、半导体芯片等行业和领域都应用了高性能计算。”吴结生指出。
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
【EMNLP2024】阿里云人工智能平台 PAI 多篇论文入选 EMNLP2024
阿里云人工智能平台 PAI 的多篇论文在 EMNLP2024 上入选。论文成果是阿里云与华南理工大学金连文教授团队、复旦大学王鹏教授团队共同研发。EMNLP 是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选标志着阿里云人工智能平台 PAI 在自然语言处理和多模态算法能力方面研究获得了学术界认可。
|
11天前
|
人工智能 资源调度 数据可视化
【AI应用落地实战】智能文档处理本地部署——可视化文档解析前端TextIn ParseX实践
2024长沙·中国1024程序员节以“智能应用新生态”为主题,吸引了众多技术大咖。合合信息展示了“智能文档处理百宝箱”的三大工具:可视化文档解析前端TextIn ParseX、向量化acge-embedding模型和文档解析测评工具markdown_tester,助力智能文档处理与知识管理。

热门文章

最新文章