使用MongoDB 构建AI:轻松应对从预测式AI到生成式AI

本文涉及的产品
云数据库 Tair(兼容Redis),内存型 2GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
简介: 无论企业目前处于AI发展的哪个阶段,MongoDB均可提供支持

毫无疑问,如今从生成式AI (GenAI )中获益最大的是那些早已运用预测式AI (Predictive AI )的组织。2023年6月,麦肯锡在2023年6月发布的《生成式人工智能的经济潜力》研究中得出了与此相同的结论 (报告链接:https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-ai-the-next-productivity-frontier )。

原因主要有以下几点:

  • 内部文化决定组织是否愿意尝试和探索人工智能
  • 组织是否具备相关技能,但必须强调的是相比预测式AI,生成式AI更依赖于开发者,而不是数据科学家
  • 组织是否拥有准确无误、精心挑选的数据,可随时输入到GenAI模型中

但这并不意味着只有具备预测式AI使用经验的团队才能从生成式AI中获益。如果分析研究MongoDB “构建AI案例研究系列” 中的实例,不难发现,许多处于不同AI成熟度阶段的组织都在利用MongoDB进行人工智能创新。

本文介绍两家企业,它们成功地构建了预测式AI应用程序,并朝着生成式AI的方向迈进:

  • MyGamePlan助力职业足球运动员和教练提升球队表现。
  • Ferret.ai利用公开数据进行背景调查,帮助企业和消费者之间建立信任。

在这两个案例中,预测式AI成为数据驱动型决策的核心。如今,这两家公司都正在探索生成式AI,希望通过推出新产品来扩展服务,以提高用户参与度。两者的共同之处是他们都选择了MongoDB Atlas,并将其灵活运用到各种AI用例中。

MyGamePlan:利用AI驱动的洞察力提升职业足球运动员的表现

利用数据和分析来提升职业运动员表现的做法并不新鲜。但是,解决方案往往极其复杂,需要集成来自多个数据提供者的数据,导致成本高昂且洞察时间长。MyGamePlan专注于协助职业足球俱乐部和球员改变这种状况。

很多欧洲优秀的球队工作人员和球员都正在使用MyGamePlan,其中包括勒沃库森足球俱乐部 (Bayer Leverkusen,目前位列德国足球甲级联赛第一名 )、桑德兰足球俱乐部 (AFC Sunderland,英冠联赛 )、卡斯特利翁足球俱乐部 (CD Castellón,目前位列西班牙第三级别联赛第一名 )及弗罗茨瓦夫西里西亚足球俱乐部 (Slask Wroclaw,目前位列波兰足球甲级联赛第一名 )。

据MyGamePlan首席技术官兼联合创始人Dries Deprest介绍,MyGamePlan借助前沿分析、AI技术及用户友好型平台实现了赛事数据、球员跟踪数据和视频资源数据的无缝集成,并重新定义了足球分析的方式。平台可以实现工作流程自动化,帮助教练和球员制定比赛战术、促进球员发展并推动卓越战略实施,从而助力球队取得胜利。

MyGamePlay平台的核心是基于Python的自定义预测式AI模型。这些模型托管在Amazon Sagemaker上,能够分析比赛的特定时刻,对球员的个人表现及其对球队的贡献进行评分。此外,这些模型还可以推測球员的表现和贡献,并与对手球队的球员进行比较,以帮助制定比赛日战术。

数据是确保模型和预测准确性的关键。该公司将MongoDB Atlas作为其数据库,用于存储:

  • 每场比赛的元数据,包括比赛、球队和球员的数据。
  • 每场比赛的事件数据,如传球、断球、犯规和射门等。
  • 跟踪遥测数据,可每隔100毫秒捕捉每位球员在场的位置。

这些数据可从MongoDB迁移到Python DataFrames,与第三方数据流结合使用,共同训练公司的ML模型。同时,可从特定比赛序列中生成推论并将其存储回MongoDB Atlas,供教练和球员进行下游分析。
image.png

图1:利用MyGamePlan网页和手机应用,教练和球员可以即时评估比赛并制定战术。

Deprest表示,MyGamePlan正在使用AI模型持续丰富数据,并将这些数据用于洞察和分析,因此MongoDB非常适合这一用例。

两年前,MyGamePlan启动了开发项目,从那时起便开始采用MongoDB。数据涉及复杂的多向关系,需要将比赛与球员、事件和跟踪相互关联。为了更好地表示这种数据关系,MyGamePlan选择在丰富的文档结构中使用嵌套元素。这种方法不仅能够提高开发者的工作效率,还能够提升程序运行效率。如果使用外键创建关系模型,再连接关系数据库中的规范化表格,这样极为缓慢且低效。

在开发方面,Deprest表示,使用PyMongo driver将MongoDB与托管在Sagemaker的Python ML数据管道和MongoDB Node.js driver集成在一起,随后将其用于基于React、面向客户端的网页和移动应用程序。

Deprest认为,造成MongoDB与NoSQL数据之间差异的两个关键因素在于:首先,MongoDB更受开发者的青睐,采用率更高。这就意味着团队能够快速熟悉它,并利用它来提高效率。其次,用户可以直接在实时数据的基础上构建应用内部分析,无需花费时间和金钱将其移动到数据仓库或数据湖中。借助MongoDB的聚合管道,用户可以使用强大的滚动、变换和窗口函数来处理和分析数据,以根据需求对数据进行切片和切块。

除了预测式AI,MyGamePlan团队正在评估如何利用GenAI来进一步改善用户体验。

据Deprest介绍,MyGamePlan平台拥有丰富的数据和分析,希望让球员和教练能够更加轻松地从中获得洞见。为此,他们正在探索在数据之上进行自然语言处理,并通过聊天和问答界面来实现这一目标。借助GenAI,用户可以轻松地可视化并总结数据。目前,团队正在评估将OpenAI旗下大型语言模型 (LLM )ChatGPT与复杂的提示工程方法相结合,同时利用LangChain进行编排,配合使用LlamaIndex和MongoDB Atlas Vector Search来实现检索增强生成 (RAG )的能力。

基于MongoDB Atlas来构建应用,使MyGamePlan团队能够利用开发者数据平台的丰富功能,为未来的几乎所有应用和AI需求提供支持。用Deprest的话来说,就是:“由于MyGamePlan的源数据保存在MongoDB Atlas数据库中,将其与向量存储及就地向量搜索结合使用为我们的开发者提供了一种非常高效且完美的解决方案。”

Ferret.ai:通过AI和MongoDB Atlas生成智能,解析关系以创建信任,同时降低成本达30%

无论在现实世界还是在数学世界,我们都在不断地与他人建立关系。不论是线上交易、厂商或专业人士与潜在客户,还是投资者与企业创始人或者其他方面,建立新的人际关系不可避免。在所有这些关系中,信任必不可少,然而建立信任却是一件非常具有挑战性的事情。Ferret.ai正是这样一款旨在帮助消除猜疑、建立信任的工具。

Ferret是一个AI平台,专注于为公司和个人提供实时、公正的情报,以识别风险并把握机遇。借助先进的预测式和生成式AI,结合成千上万的全球数据源及数十亿公开文件,Ferret.ai可提供精心策划的关系情报和监测服务 (这些服务以往仅限于金融行业使用 ),帮助树立透明度新标准。

Ferret首席技术官Al Basseri在谈及Ferret的工作原理时表示,Ferret.ai从公共来源中获取个人信息。这些来源包括社交网络、交易记录、法庭文件、新闻档案、公司所有权和注册商业利益等。相关数据通过Kafka管道传输到公司的Anyscale/Ray MLops平台,在这个平台上,再使用spaCy提取和机器学习模型来进行自然语言处理。Ferret.ai从数据源中获得的所有元数据 (接近30亿个文档 )及模型推断均存储在MongoDB Atlas中。用户可通过页面和移动客户应用程序,企业用户可通过即将推出API来使用Atlas中的数据。
image.png

图2:人工智能+实时数据=来自Ferret.ai的关系智能

除了预测式AI之外,公司开发者目前正在尝试在Ferret平台上使用GenAI。Basseri表示,Ferret与英伟达的数据科学团队建立了紧密的合作关系,从而能够对所提供的数据来源和分析进行综合,以帮助客户更好地了解联系人,并建立良好的关系。实验表明,相比那些规模更大、更通用的大型语言模型,Mistral模型及其混合专家集成系统所需的资源开销更少。

除了托管来自Ferret的预测式和生成式AI模型数据外,客户数据和联系人列表也存储在MongoDB Atlas中。Ferret可对公共记录源进行持续监测和评分,及时检测个人身份信息的变化。

正如Basseri所介绍的,通过使用MongoDB Atlas Triggers,Ferret.ai可以监测评分的更新,并立即向消费应用程序发送警报,从而使客户能够实时了解关系网络动态。这是一种具有反应式的、完全基于事件驱动的程序,开发者只需进行设置即可轻松实现。

Basseri还介绍了MongoDB为其开发者带来的其它一些优势,其中包括

  • 借助Atlas,该服务以完全托管的形式提供,并融入了最佳实践。这使开发者和数据科学家可以从数据库运行工作中解脱出来,将精力投入到应用程序和AI创新上
  • MongoDB Atlas是一种成熟的解决方案,已被广泛应用于许多高增长的企业
  • 随着团队的迅速扩展,拥有了解MongoDB的工程师变得至关重要

除了数据库之外,Ferret正将其对MongoDB Atlas平台的应用扩展到文本搜索领域。随着公司进入谷歌云,其正在从现有的Amazon OpenSearch 服务迁移到Atlas Search。

在谈及迁移的驱动因素时,Basseri表示:“将数据库和搜索统一在同一个API有助于减少开发者的认知负荷,从而提高他们的工作效率,加快新功能的构建。这样可以消除了数据库和搜索之间同步数据带来的不便,从而缩短了工程周期。此外,这也意味着用户可以获得更好的体验,因为之前的延迟瓶颈已经消失,用户在Ferret平台上搜索联系人和内容时,可以得到最新的结果,而不是过时的数据。从OpenSearch迁移到Atlas Search还可以节省资金成本,并获得更多的灵活性。通过消除数据库和搜索引擎之间不必要的数据冗余,可将每月的总云成本减少30%。由于Atlas是支持多云的开发者数据平台,因此可以根据需要在多个云提供商之间迁移。”

迁移完成后,Basseri及其团队将能够使用Atlas Vector Search进行开发,并继续构建Ferret平台的GenAI功能。

从以上两个案例可以看出,无论企业目前处于AI发展的哪个阶段,MongoDB均可提供支持。如需了解更多信息,欢迎关注MongoDB微信公众号“MongoDB数据库”。

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
14天前
|
人工智能
巧妙构建歌词结构:写歌词的技巧和方法之关键,妙笔生词AI智能写歌词软件
在音乐世界里,歌词是灵魂的载体,构建其结构至关重要。优秀的歌词需有引人入胜的开头、条理清晰且富变化的主体,以及深刻难忘的结尾。《妙笔生词智能写歌词软件》提供多种功能,帮助创作者克服结构难题,激发灵感,助你写出打动人心的歌词,开启音乐创作的新篇章。
|
7天前
|
人工智能 前端开发 Java
基于开源框架Spring AI Alibaba快速构建Java应用
本文旨在帮助开发者快速掌握并应用 Spring AI Alibaba,提升基于 Java 的大模型应用开发效率和安全性。
基于开源框架Spring AI Alibaba快速构建Java应用
|
6天前
|
人工智能 运维 NoSQL
云栖大会|多模+一体化,构建更高效的AI应用
在2024年云栖大会「NoSQL数据库」专场,多位知名企业和阿里云瑶池数据库团队的技术专家,共同分享了阿里云Lindorm、Tair、MongoDB和MyBase的最新进展与实践。Tair推出Serverless KV服务,解决性能瓶颈和运维难题;Lindorm助力AI和具身智能时代的多模数据处理;MongoDB云原生化提升开发效率;MyBase One打破云边界,提供云边端一体化服务。这些技术进展和最佳实践,展示了阿里云在NoSQL数据库领域的创新能力和广泛应用前景。
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI驱动的个性化学习平台构建###
【10月更文挑战第29天】 本文将深入探讨如何利用人工智能技术,特别是机器学习与大数据分析,构建一个能够提供高度个性化学习体验的在线平台。我们将分析当前在线教育的挑战,提出通过智能算法实现内容定制、学习路径优化及实时反馈机制的技术方案,以期为不同背景和需求的学习者创造更加高效、互动的学习环境。 ###
24 3
|
13天前
|
人工智能 API 决策智能
swarm Agent框架入门指南:构建与编排多智能体系统的利器 | AI应用开发
Swarm是OpenAI在2024年10月12日宣布开源的一个实验性质的多智能体编排框架。其核心目标是让智能体之间的协调和执行变得更轻量级、更容易控制和测试。Swarm框架的主要特性包括轻量化、易于使用和高度可定制性,非常适合处理大量独立的功能和指令。【10月更文挑战第15天】
96 6
|
14天前
|
人工智能
写歌词的技巧和方法:构建独特歌词结构的策略,妙笔生词AI智能写歌词软件
歌词创作如同搭建艺术殿堂,独特的歌词结构是其基石。掌握构建策略,让你的歌词脱颖而出。开头营造神秘氛围或出人意料的情感,主体部分采用倒叙、插叙或融合矛盾情感,结尾带来情感反转或深邃思考。《妙笔生词智能写歌词软件》提供 AI 智能写词、押韵优化等功能,助你轻松获取灵感,打造独特歌词结构。
|
21天前
|
人工智能 Android开发
1024 云上见 构建AI总结助手,实现智能文档摘要 领罗马仕安卓充电器
1024 云上见 构建AI总结助手,实现智能文档摘要 领罗马仕安卓充电器
48 1
|
1月前
|
存储 关系型数据库 MySQL
一个项目用5款数据库?MySQL、PostgreSQL、ClickHouse、MongoDB区别,适用场景
一个项目用5款数据库?MySQL、PostgreSQL、ClickHouse、MongoDB——特点、性能、扩展性、安全性、适用场景比较
|
12天前
|
NoSQL Cloud Native atlas
探索云原生数据库:MongoDB Atlas 的实践与思考
【10月更文挑战第21天】本文探讨了MongoDB Atlas的核心特性、实践应用及对云原生数据库未来的思考。MongoDB Atlas作为MongoDB的云原生版本,提供全球分布式、完全托管、弹性伸缩和安全合规等优势,支持快速部署、数据全球化、自动化运维和灵活定价。文章还讨论了云原生数据库的未来趋势,如架构灵活性、智能化运维和混合云支持,并分享了实施MongoDB Atlas的最佳实践。
|
13天前
|
NoSQL Cloud Native atlas
探索云原生数据库:MongoDB Atlas 的实践与思考
【10月更文挑战第20天】本文探讨了MongoDB Atlas的核心特性、实践应用及对未来云原生数据库的思考。MongoDB Atlas作为云原生数据库服务,具备全球分布、完全托管、弹性伸缩和安全合规等优势,支持快速部署、数据全球化、自动化运维和灵活定价。文章还讨论了实施MongoDB Atlas的最佳实践和职业心得,展望了云原生数据库的发展趋势。