机器学习技术在亲宝宝的业务应用

本文涉及的产品
DataWorks Serverless资源组免费试用套餐,300CU*H 3个月
简介: 亲宝宝以MaxCompute的计算和存储能力为依托,构建了整个大数据链路,数据源包括了APP的埋点、Nginx、CDN。使用阿里云的日志服务、流计算、函数计算、DTS等将数据导入到MaxCompute中,在MaxCompute进行数据加工,在这个基础上快速构建用户圈选、BI报表、机器学习和个性化推荐等相关应用。

亲宝宝大数据技术负责人 熊杰

首先向大家简单介绍下亲宝宝,亲宝宝APP是在2013年1月正式上线的。我们定义亲宝宝为新一代家庭育儿方式,我们的使命就是运用科技的力量,帮助家庭更好的关爱和培养孩子。

1.png

目前亲宝宝一共扩展了6项业务:成长记录、智能育儿助手、自有商品品牌、早教课程、品牌广告以及智能硬件,其中成长记录、智能育儿助手是APP最核心两大业务模块。

2.png

截止目前,亲宝宝APP已经有累积1亿多的注册用户,月访问量达到了2000万以上,日均文件传输超过了1000万个,服务超过了5000万家庭。

这5000万个年轻家庭中用户的分布是以妈妈为主,其次是爸爸和祖辈。以宝宝为纽带,构成了我们整个APP的用户画像基础。基于用户画像,我们会做不同的运营策略,例如中国的家庭隔代育儿现象会比较普遍,目前祖辈的智能手机普及率也比较高,我们会针对性地推送相关内容,帮助祖辈来接收科学的育儿理念。

3.png

4.png

亲宝宝以MaxCompute的计算和存储能力为依托,构建了整个大数据链路,数据源包括了APP的埋点、Nginx、CDN。使用阿里云的日志服务、流计算、函数计算、DTS等将数据导入到MaxCompute中,在MaxCompute进行数据加工,在这个基础上快速构建用户圈选、BI报表、机器学习和个性化推荐等相关应用。

5.png

亲宝宝基于 MaxCompute 加阿里云机器学习 PAI 来构建用户画像和家庭画像服务,包括了数据加工以及策略标签管理与用户家庭画像。

6.png

我们开发了智能营销系统IMS,结合画像数据,一方面可以针对宝宝在成长过程中的发育特点,推送小报、育儿知识等内容,做个性化的科学的育儿指导。另一方面结合用户家庭对品牌的偏好,精准投放广告。方案上我们使用了MaxCompute加工标签,然后以BitMap的方式存储到PostgreSql数据库,实现快速高效的用户圈选。基于阿里云的MaxCompute、PAI、EMR、流计算、OSS等产品,搭建了个性化推荐系统。

7.png

上图就是我们一个典型的个性化推荐系统的框架结构,最后通过用户的行为反馈,对模型和策略做不断的迭代。

8.jpg

从收益上来看,可以提升亲宝优品30%以上的UV价值,以及50%以上的点击率,亲子小报可以提升60%以上的阅读时长和50%左右的点击率。

9.png

成长记录是亲宝宝APP的两大核心业务之一,用户每天上传了很多的照片和视频,对于如何帮助用户更好的管理这些文件,我们在图像和视频领域进行了非常多的探索和尝试。旨在通过机器学习技术手段帮助我们的产品进行演进。

10.jpg

上图就是我们在图像和视频领域部署的相关应用。在服务端我们有人脸检测,敏感内容分析,表情识别、文字检测与识别等。服务端每天要处理千万级别的照片以及百万级别的视频,需要消耗巨大的资源,所以我们把这些服务部署在Serverless,可以弹性扩容,这为我们节省了50%以上的费用。

另外在客户端为了帮助用户更快捷方便的一键上传照片,针对儿童的人像特点,我们开发了人脸检测、年龄检测、图像质量分析等SDK。为了解决性能和模型 ROM size的问题,我们采用了NCNN的框架,后来阿里有推出过MNN的框架,我们也做了尝试。

11.jpg

这是我们一个应用事例:在检测到家庭合照以后,一个合适的时机生成一个mv推送给用户,给用户一个小惊喜。

12.jpg

通过以上的图像和视频技术,我们的业务有极大的提升,我们的新用户的文件上传量增加了90%,mv的点击量提高了60%。

13.png

关于智能育儿助手这个模块前面有提到过,基于用户画像,针对宝宝的特点提供个性化的育儿指导。

14.jpg

除了个性化的育儿指导,我们还开发了智能问答系统,这一页就是我们智能问答系统的方案,用户的育儿问题通过机器分类,选择给KOL、运营以及智能育儿助手来回答。分发到智能育儿助手的问题,可以借助我们NLP技术,并结合用户画像信息,实现高效并科学地回答用户提问。

15.jpg

目前我们的问答系统完成了1000多个知识点语料标注。

亲宝宝在机器学习技术和应用上具有强烈的好奇心和愿望,希望通过机器学习技术帮助年轻家庭更好的关爱和培养孩子。当然也希望阿里云能够推出更多的更好的产品,拓展我们在机器学习的应用边界。

谢谢大家!

更多大数据客户实战案例:https://developer.aliyun.com/article/772449

首月199元开通DataWorks专业版+MaxCompute按量付费黄金搭档:

https://dw-common-buy.data.aliyun.com/promc

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 课程目标  通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者
相关文章
|
22天前
|
人工智能 Anolis
展示全栈式AI平台,探讨软硬件技术!英特尔分论坛议程来啦 | 2024 龙蜥大会
英特尔分论坛将依托英特尔云到端的全面产品组合,围绕至强可扩展处理器、AI 加速器、以及 oneAPI、OpenVINO 等软硬件技术展开探讨。
展示全栈式AI平台,探讨软硬件技术!英特尔分论坛议程来啦 | 2024 龙蜥大会
|
9天前
|
机器学习/深度学习 人工智能 算法
探索人工智能:机器学习的奥秘与应用
本文深入浅出地探讨了人工智能领域中的核心技术——机器学习,揭示了其背后的原理和广泛的实际应用。通过浅显易懂的语言和生动的例子,本文旨在为非专业读者打开一扇了解并利用机器学习的大门,同时激发对这一前沿技术的兴趣和思考。
23 1
|
11天前
|
机器学习/深度学习 人工智能 搜索推荐
如何让你的Uno Platform应用秒变AI大神?从零开始,轻松集成机器学习功能,让应用智能起来,用户惊呼太神奇!
【9月更文挑战第8天】随着技术的发展,人工智能与机器学习已融入日常生活,特别是在移动应用开发中。Uno Platform 是一个强大的框架,支持使用 C# 和 XAML 开发跨平台应用(涵盖 Windows、macOS、iOS、Android 和 Web)。本文探讨如何在 Uno Platform 中集成机器学习功能,通过示例代码展示从模型选择、训练到应用集成的全过程,并介绍如何利用 Onnx Runtime 等库实现在 Uno 平台上的模型运行,最终提升应用智能化水平和用户体验。
26 1
|
19天前
|
机器学习/深度学习 存储 前端开发
实战揭秘:如何借助TensorFlow.js的强大力量,轻松将高效能的机器学习模型无缝集成到Web浏览器中,从而打造智能化的前端应用并优化用户体验
【8月更文挑战第31天】将机器学习模型集成到Web应用中,可让用户在浏览器内体验智能化功能。TensorFlow.js作为在客户端浏览器中运行的库,提供了强大支持。本文通过问答形式详细介绍如何使用TensorFlow.js将机器学习模型带入Web浏览器,并通过具体示例代码展示最佳实践。首先,需在HTML文件中引入TensorFlow.js库;接着,可通过加载预训练模型如MobileNet实现图像分类;然后,编写代码处理图像识别并显示结果;此外,还介绍了如何训练自定义模型及优化模型性能的方法,包括模型量化、剪枝和压缩等。
27 1
|
20天前
|
机器学习/深度学习 数据采集 人工智能
探索机器学习在金融欺诈检测中的应用
【8月更文挑战第30天】 随着金融科技的迅猛发展,机器学习技术在保障交易安全和打击金融欺诈中扮演着越来越重要的角色。本文将深入探讨机器学习模型在识别和预防金融欺诈方面的应用,并分析其优势与面临的挑战。通过对比传统方法,我们突出了机器学习在处理大数据、提高检测速度和精度方面的独特价值。同时,文中还将介绍几种常用的算法和模型,以及它们在实际场景中的运用情况。最后,本文提出了未来发展趋势和需要解决的关键问题。
|
19天前
|
图形学 机器学习/深度学习 人工智能
颠覆传统游戏开发,解锁未来娱乐新纪元:深度解析如何运用Unity引擎结合机器学习技术,打造具备自我进化能力的智能游戏角色,彻底改变你的游戏体验——从基础设置到高级应用全面指南
【8月更文挑战第31天】本文探讨了如何在Unity中利用机器学习增强游戏智能。作为领先的游戏开发引擎,Unity通过ML-Agents Toolkit等工具支持AI代理的强化学习训练,使游戏角色能自主学习完成任务。文章提供了一个迷宫游戏示例及其C#脚本,展示了环境观察、动作响应及奖励机制的设计,并介绍了如何设置训练流程。此外,还提到了Unity与其他机器学习框架(如TensorFlow和PyTorch)的集成,以实现更复杂的游戏玩法。通过这些技术,游戏的智能化程度得以显著提升,为玩家带来更丰富的体验。
36 0
|
19天前
|
C# 机器学习/深度学习 搜索推荐
WPF与机器学习的完美邂逅:手把手教你打造一个具有智能推荐功能的现代桌面应用——从理论到实践的全方位指南,让你的应用瞬间变得高大上且智能无比
【8月更文挑战第31天】本文详细介绍如何在Windows Presentation Foundation(WPF)应用中集成机器学习功能,以开发具备智能化特性的桌面应用。通过使用Microsoft的ML.NET框架,本文演示了从安装NuGet包、准备数据集、训练推荐系统模型到最终将模型集成到WPF应用中的全过程。具体示例代码展示了如何基于用户行为数据训练模型,并实现实时推荐功能。这为WPF开发者提供了宝贵的实践指导。
26 0
|
19天前
|
Java 前端开发 容器
Struts 2:在技术变革的风暴中航行,探索框架的革命性未来与创新融合之路
【8月更文挑战第31天】Struts 2作为一款成熟的企业级Java Web框架,凭借其稳定性和灵活性自2007年以来广受欢迎。它基于MVC设计模式,支持插件架构和RESTful服务,并能与Spring框架良好集成。然而,面对微服务架构和容器化技术(如Docker和Kubernetes)的兴起,Struts 2需提供更轻量级和支持指南来适应变化。通过深化与现代前端框架(如React和Vue.js)及AI技术的集成,并强化安全性与开发工具,Struts 2有望保持竞争力并迎接未来挑战。
30 0
|
19天前
|
API UED 开发者
如何在Uno Platform中轻松实现流畅动画效果——从基础到优化,全方位打造用户友好的动态交互体验!
【8月更文挑战第31天】在开发跨平台应用时,确保用户界面流畅且具吸引力至关重要。Uno Platform 作为多端统一的开发框架,不仅支持跨系统应用开发,还能通过优化实现流畅动画,增强用户体验。本文探讨了Uno Platform中实现流畅动画的多个方面,包括动画基础、性能优化、实践技巧及问题排查,帮助开发者掌握具体优化策略,提升应用质量与用户满意度。通过合理利用故事板、减少布局复杂性、使用硬件加速等技术,结合异步方法与预设缓存技巧,开发者能够创建美观且流畅的动画效果。
43 0
|
19天前
|
UED 存储 数据管理
深度解析 Uno Platform 离线状态处理技巧:从网络检测到本地存储同步,全方位提升跨平台应用在无网环境下的用户体验与数据管理策略
【8月更文挑战第31天】处理离线状态下的用户体验是现代应用开发的关键。本文通过在线笔记应用案例,介绍如何使用 Uno Platform 优雅地应对离线状态。首先,利用 `NetworkInformation` 类检测网络状态;其次,使用 SQLite 实现离线存储;然后,在网络恢复时同步数据;最后,通过 UI 反馈提升用户体验。
33 0

热门文章

最新文章