客户分享:PAI 在亲宝宝的业务应用|学习笔记

简介: 快速学习客户分享:PAI 在亲宝宝的业务应用。

开发者学堂课程【PAL 平台学习路线:机器学习入门到应用:客户分享:PAI 在亲宝宝的业务应用】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/855/detail/14137


客户分享:PAI 在亲宝宝的业务应用

 

APP简介

亲宝宝 app 在2013年上线,定义亲宝宝为新一代家庭育儿方式,使命就是运用科技力量,帮助家庭更好关爱和培养孩子。目前,亲宝宝一共扩展了6个主要业务:

(1) 成长记录

(2) 智能育儿助手

(3) 自由商品品牌

(4) 早教课程

(5) 品牌广告

(6) 智能硬件

数据上,已经累积了1亿以上注册用户,达到了2,000万以上访问量,日均文件传输超过了1,000万,服务超过了5,000万以上家庭,5,000万个年轻家庭中,用户分布以妈妈为主,其次爸爸和祖辈,在以宝宝为纽带,构成了整个app用户画像基础,在基础上做不同运营策略,例如中国家庭隔代育儿现象较为普遍,目前祖辈智能手机普及率也较高,针对性推送相关内容,帮助接收科学育儿理念。

以下是亲宝宝如何完成个性化推荐以及用户画方案的方式:新宝宝以 max computer 计算和存储能力为依托构建了整个大数学电路,数据员包括了 APP 埋点,Nginx cdn 使用阿里云日志服务、流计算、函数计算、dts等,将数据导入到 max computer 中,在 max computer 进行数据加工,在该基础上快速构建用户圈选,BI 报表,机器学习和个性化推荐等相关应用。亲宝宝基于 max computer+PAI 来构建用户画像和家庭画像服务,包括了从数据加工以及策略标签管理与用户家庭画像开发了智能营销系统 ims,结合画像数据,一方面可以针对宝宝在成长过程中发育特点,推送小报,育儿知识等内容,做个性化科学育儿指导;另一方面,结合用户家庭对品牌偏好,精准投放广告,方案上使用了max computer 加工标签,以 PETER MAP 方式存储到 PG 数据库,实现快速高效用户圈选,基于阿里云max computer、EM8、计算、oss 等产品搭建了个性化推荐系统,以下为典型个性化推荐系统框架结构:

 image.png

最后通过用户行为反馈,对模型和策略做不断迭代,从收益上来看,可以提升轻薄优品30%以上UV价值以及50%以上点击率,新词小报,可以提升60%以上阅读时长和50%左右的点击率,成长记录是 APP 的核心业务,用户每天上传了许多照片和视频,如何帮助用户更好管理照片视频,在图像和视频领域,进行了很多探索和尝试,希望通过机器学习技术手段,帮助产品进行演进,以下为在图像和视频领域部署的相关应用:

 image.png

在服务端有人员检测、敏感内容分析、表情识别、文字检测与识别等,服务端每天要处理千万级别照片以及百万级别视频,需要消耗巨大资源,所以把服务部署在 service,可以弹性扩容,节省了50%以上费用,另外在客户端为了帮助用户更快捷方便的一键上传照片,针对儿童人特点,开发了人脸检测,年龄检测,图像质量分析等。SDK为了解决性能和模型 room size 问题,采用了 ncn 框架,后来阿里有推出过 mn 框架,以下为应用实例:

image.png

在检测到家庭合照以后,合适时机生成 MV 推送给用户,通过以上图和视频技术,业务有极大提升,新用户文件上传量超过了90%,MV 点击率提高了60%,对于育儿助手模块,基于用户画像,针对宝宝的特点,提供个性化育儿指导,除了个性化育儿指导,还开发了智能问答系统,以下为系统方案:

 image.png

让用户育儿问题通过机器分类,分发给 kol、运营或智能育儿助手来回答,可以借助 nlp 技术,并结合用户画像信息,实现高效并科学回答用户提问。问答系统,完成了1,000多个知识点,近20万以上语调标注,准确率控制在95%以上。app 深受用户好评,亲宝宝在机器学习技术和应用具有强烈好奇心和愿望,希望通过积极学习技术,帮助年轻家庭更好关爱和培养孩子,希望阿里云能够推出更多更好产品,拓展在积极学习应用边界。

相关实践学习
使用PAI+LLaMA Factory微调Qwen2-VL模型,搭建文旅领域知识问答机器人
使用PAI和LLaMA Factory框架,基于全参方法微调 Qwen2-VL模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
7月前
|
人工智能 自然语言处理 数据挖掘
云上玩转Qwen3系列之三:PAI-LangStudio x Hologres构建ChatBI数据分析Agent应用
PAI-LangStudio 和 Qwen3 构建基于 MCP 协议的 Hologres ChatBI 智能 Agent 应用,通过将 Agent、MCP Server 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了 MCP+OLAP 的智能数据分析能力,使用自然语言即可实现 OLAP 数据分析的查询效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。
|
3月前
|
机器学习/深度学习 数据采集 算法
量子机器学习入门:三种数据编码方法对比与应用
在量子机器学习中,数据编码方式决定了量子模型如何理解和处理信息。本文详解角度编码、振幅编码与基础编码三种方法,分析其原理、实现及适用场景,帮助读者选择最适合的编码策略,提升量子模型性能。
317 8
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
Java 大视界 -- Java 大数据机器学习模型在自然语言生成中的可控性研究与应用(229)
本文深入探讨Java大数据与机器学习在自然语言生成(NLG)中的可控性研究,分析当前生成模型面临的“失控”挑战,如数据噪声、标注偏差及黑盒模型信任问题,提出Java技术在数据清洗、异构框架融合与生态工具链中的关键作用。通过条件注入、强化学习与模型融合等策略,实现文本生成的精准控制,并结合网易新闻与蚂蚁集团的实战案例,展示Java在提升生成效率与合规性方面的卓越能力,为金融、法律等强监管领域提供技术参考。
|
4月前
|
机器学习/深度学习 算法 Java
Java 大视界 -- Java 大数据机器学习模型在生物信息学基因功能预测中的优化与应用(223)
本文探讨了Java大数据与机器学习模型在生物信息学中基因功能预测的优化与应用。通过高效的数据处理能力和智能算法,提升基因功能预测的准确性与效率,助力医学与农业发展。
|
4月前
|
机器学习/深度学习 搜索推荐 数据可视化
Java 大视界 -- Java 大数据机器学习模型在电商用户流失预测与留存策略制定中的应用(217)
本文探讨 Java 大数据与机器学习在电商用户流失预测与留存策略中的应用。通过构建高精度预测模型与动态分层策略,助力企业提前识别流失用户、精准触达,实现用户留存率与商业价值双提升,为电商应对用户流失提供技术新思路。
|
4月前
|
机器学习/深度学习 存储 分布式计算
Java 大视界 --Java 大数据机器学习模型在金融风险压力测试中的应用与验证(211)
本文探讨了Java大数据与机器学习模型在金融风险压力测试中的创新应用。通过多源数据采集、模型构建与优化,结合随机森林、LSTM等算法,实现信用风险动态评估、市场极端场景模拟与操作风险预警。案例分析展示了花旗银行与蚂蚁集团的智能风控实践,验证了技术在提升风险识别效率与降低金融风险损失方面的显著成效。
|
5月前
|
机器学习/深度学习 分布式计算 Java
Java 大视界 -- Java 大数据机器学习模型在遥感图像土地利用分类中的优化与应用(199)
本文探讨了Java大数据与机器学习模型在遥感图像土地利用分类中的优化与应用。面对传统方法效率低、精度差的问题,结合Hadoop、Spark与深度学习框架,实现了高效、精准的分类。通过实际案例展示了Java在数据处理、模型融合与参数调优中的强大能力,推动遥感图像分类迈向新高度。
|
5月前
|
机器学习/深度学习 存储 Java
Java 大视界 -- Java 大数据机器学习模型在游戏用户行为分析与游戏平衡优化中的应用(190)
本文探讨了Java大数据与机器学习模型在游戏用户行为分析及游戏平衡优化中的应用。通过数据采集、预处理与聚类分析,开发者可深入洞察玩家行为特征,构建个性化运营策略。同时,利用回归模型优化游戏数值与付费机制,提升游戏公平性与用户体验。
|
7月前
|
机器学习/深度学习 数据采集 人工智能
智能嗅探AJAX触发:机器学习在动态渲染中的创新应用
随着Web技术发展,动态加载数据的网站(如今日头条)对传统爬虫提出新挑战:初始HTML无完整数据、请求路径动态生成且易触发反爬策略。本文以爬取“AI”相关新闻为例,探讨了通过浏览器自动化、抓包分析和静态逆向接口等方法采集数据的局限性,并提出借助机器学习智能识别AJAX触发点的解决方案。通过特征提取与模型训练,爬虫可自动推测数据接口路径并高效采集。代码实现展示了如何模拟AJAX请求获取新闻标题、简介、作者和时间,并分类存储。未来,智能化将成为采集技术的发展趋势。
195 1
智能嗅探AJAX触发:机器学习在动态渲染中的创新应用
|
11月前
|
机器学习/深度学习 数据采集 JSON
Pandas数据应用:机器学习预处理
本文介绍如何使用Pandas进行机器学习数据预处理,涵盖数据加载、缺失值处理、类型转换、标准化与归一化及分类变量编码等内容。常见问题包括文件路径错误、编码不正确、数据类型不符、缺失值处理不当等。通过代码案例详细解释每一步骤,并提供解决方案,确保数据质量,提升模型性能。
457 88

热门文章

最新文章