您的位置:聚焦网>新闻>国内>正文

使用MongoDB构建AI:轻松应对从预测式AI到生成式AI

2024/4/11 8:28:25 来源:

毫无疑问,如今从生成式AI (GenAI )中获益最大的是那些早已运用预测式AI (Predictive AI )的组织。2023年6月,麦肯锡在2023年6月发布的《生成式人工智能的经济潜力》研究中得出了与此相同的结论 (报告链接:https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-ai-the-next-productivity-frontier )。

 

原因主要有以下几点:

1. 内部文化决定组织是否愿意尝试和探索人工智能

2. 组织是否具备相关技能,但必须强调的是相比预测式AI,生成式AI更依赖于开发者,而不是数据科学家

3. 组织是否拥有准确无误、精心挑选的数据,可随时输入到GenAI模型中

但这并不意味着只有具备预测式AI使用经验的团队才能从生成式AI中获益。如果分析研究MongoDB“构建AI案例研究系列” 中的实例,不难发现,许多处于不同AI成熟度阶段的组织都在利用MongoDB进行人工智能创新。

 

本文介绍两家企业,它们成功地构建了预测式AI应用程序,并朝着生成式AI的方向迈进:

1. MyGamePlan助力职业足球运动员和教练提升球队表现。

2. Ferret.ai利用公开数据进行背景调查,帮助企业和消费者之间建立信任。

在这两个案例中,预测式AI成为数据驱动型决策的核心。如今,这两家公司都正在探索生成式AI,希望通过推出新产品来扩展服务,以提高用户参与度。两者的共同之处是他们都选择了MongoDB Atlas,并将其灵活运用到各种AI用例中。

 

MyGamePlan: 利用AI驱动的洞察力提升职业足球运动员的表现

利用数据和分析来提升职业运动员表现的做法并不新鲜。但是,解决方案往往极其复杂,需要集成来自多个数据提供者的数据,导致成本高昂且洞察时间长。MyGamePlan专注于协助职业足球俱乐部和球员改变这种状况。

很多欧洲优秀的球队工作人员和球员都正在使用MyGamePlan,其中包括勒沃库森足球俱乐部 (Bayer Leverkusen,目前位列德国足球甲级联赛第一名 )、桑德兰足球俱乐部 (AFC Sunderland,英冠联赛 )、卡斯特利翁足球俱乐部 (CD Castellón,目前位列西班牙第三级别联赛第一名 )及弗罗茨瓦夫西里西亚足球俱乐部 (Slask Wroclaw,目前位列波兰足球甲级联赛第一名 )。

据MyGamePlan首席技术官兼联合创始人Dries Deprest介绍,MyGamePlan借助前沿分析、AI技术及用户友好型平台实现了赛事数据、球员跟踪数据和视频资源数据的无缝集成,并重新定义了足球分析的方式。平台可以实现工作流程自动化,帮助教练和球员制定比赛战术、促进球员发展并推动卓越战略实施,从而助力球队取得胜利。

MyGamePlay平台的核心是基于Python的自定义预测式AI模型。这些模型托管在Amazon Sagemaker上,能够分析比赛的特定时刻,对球员的个人表现及其对球队的贡献进行评分。此外,这些模型还可以推測球员的表现和贡献,并与对手球队的球员进行比较,以帮助制定比赛日战术。

 

数据是确保模型和预测准确性的关键。该公司将MongoDB Atlas作为其数据库,用于存储:

1. 每场比赛的元数据,包括比赛、球队和球员的数据。

2. 每场比赛的事件数据,如传球、断球、犯规和射门等。

3. 跟踪遥测数据,可每隔100毫秒捕捉每位球员在场的位置。

这些数据可从MongoDB迁移到Python DataFrames,与第三方数据流结合使用,共同训练公司的ML模型。同时,可从特定比赛序列中生成推论并将其存储回MongoDB Atlas,供教练和球员进行下游分析。

图1: 利用MyGamePlan网页和手机应用,教练和球员可以即时评估比赛并制定战术。

Deprest表示,MyGamePlan正在使用AI模型持续丰富数据,并将这些数据用于洞察和分析,因此MongoDB非常适合这一用例。

两年前,MyGamePlan启动了开发项目,从那时起便开始采用MongoDB。数据涉及复杂的多向关系,需要将比赛与球员、事件和跟踪相互关联。为了更好地表示这种数据关系,MyGamePlan选择在丰富的文档结构中使用嵌套元素。这种方法不仅能够提高开发者的工作效率,还能够提升程序运行效率。如果使用外键创建关系模型,再连接关系数据库中的规范化表格,这样极为缓慢且低效。

在开发方面,Deprest表示,使用PyMongo driver将MongoDB与托管在Sagemaker的Python ML数据管道和MongoDB Node.js driver集成在一起,随后将其用于基于React、面向客户端的网页和移动应用程序。

Deprest认为,造成MongoDB与NoSQL数据之间差异的两个关键因素在于: 首先,MongoDB更受开发者的青睐,采用率更高。这就意味着团队能够快速熟悉它,并利用它来提高效率。其次,用户可以直接在实时数据的基础上构建应用内部分析,无需花费时间和金钱将其移动到数据仓库或数据湖中。借助MongoDB的聚合管道,用户可以使用强大的滚动、变换和窗口函数来处理和分析数据,以根据需求对数据进行切片和切块。

除了预测式AI,MyGamePlan团队正在评估如何利用GenAI来进一步改善用户体验。

据Deprest介绍,MyGamePlan平台拥有丰富的数据和分析,希望让球员和教练能够更加轻松地从中获得洞见。为此,他们正在探索在数据之上进行自然语言处理,并通过聊天和问答界面来实现这一目标。借助GenAI,用户可以轻松地可视化并总结数据。目前,团队正在评估将OpenAI旗下大型语言模型 (LLM )ChatGPT与复杂的提示工程方法相结合,同时利用LangChain进行编排,配合使用LlamaIndex和MongoDB Atlas Vector Search来实现检索增强生成 (RAG )的能力。

基于MongoDB Atlas来构建应用,使MyGamePlan团队能够利用开发者数据平台的丰富功能,为未来的几乎所有应用和AI需求提供支持。用Deprest的话来说,就是:“由于MyGamePlan的源数据保存在MongoDB Atlas数据库中,将其与向量存储及就地向量搜索结合使用为我们的开发者提供了一种非常高效且完美的解决方案。”

 

Ferret.ai: 通过AI和MongoDB Atlas生成智能,解析关系以创建信任,同时降低成本达30%

无论在现实世界还是在数学世界,我们都在不断地与他人建立关系。不论是线上交易、厂商或专业人士与潜在客户,还是投资者与企业创始人或者其他方面,建立新的人际关系不可避免。在所有这些关系中,信任必不可少,然而建立信任却是一件非常具有挑战性的事情。Ferret.ai正是这样一款旨在帮助消除猜疑、建立信任的工具。

Ferret是一个AI平台,专注于为公司和个人提供实时、公正的情报,以识别风险并把握机遇。借助先进的预测式和生成式AI,结合成千上万的全球数据源及数十亿公开文件,Ferret.ai可提供精心策划的关系情报和监测服务 (这些服务以往仅限于金融行业使用 ),帮助树立透明度新标准。

Ferret首席技术官Al Basseri在谈及Ferret的工作原理时表示,Ferret.ai从公共来源中获取个人信息。这些来源包括社交网络、交易记录、法庭文件、新闻档案、公司所有权和注册商业利益等。相关数据通过Kafka管道传输到公司的Anyscale/Ray MLops平台,在这个平台上,再使用spaCy提取和机器学习模型来进行自然语言处理。Ferret.ai从数据源中获得的所有元数据 (接近30亿个文档 )及模型推断均存储在MongoDB Atlas中。用户可通过页面和移动客户应用程序,企业用户可通过即将推出API来使用Atlas中的数据。

图2: 人工智能+实时数据=来自Ferret.ai的关系智能

除了预测式AI之外,公司开发者目前正在尝试在Ferret平台上使用GenAI。Basseri表示,Ferret与英伟达的数据科学团队建立了紧密的合作关系,从而能够对所提供的数据来源和分析进行综合,以帮助客户更好地了解联系人,并建立良好的关系。实验表明,相比那些规模更大、更通用的大型语言模型,Mistral模型及其混合专家集成系统所需的资源开销更少。

除了托管来自Ferret的预测式和生成式AI模型数据外,客户数据和联系人列表也存储在MongoDB Atlas中。Ferret可对公共记录源进行持续监测和评分,及时检测个人身份信息的变化。

正如Basseri所介绍的,通过使用MongoDB Atlas Triggers,Ferret.ai可以监测评分的更新,并立即向消费应用程序发送警报,从而使客户能够实时了解关系网络动态。这是一种具有反应式的、完全基于事件驱动的程序,开发者只需进行设置即可轻松实现。

 

Basseri还介绍了MongoDB为其开发者带来的其它一些优势,其中包括:

借助Atlas,该服务以完全托管的形式提供,并融入了最佳实践。这使开发者和数据科学家可以从数据库运行工作中解脱出来,将精力投入到应用程序和AI创新上

MongoDB Atlas是一种成熟的解决方案,已被广泛应用于许多高增长的企业

随着团队的迅速扩展,拥有了解MongoDB的工程师变得至关重要

除了数据库之外,Ferret正将其对MongoDB Atlas平台的应用扩展到文本搜索领域。随着公司进入谷歌云,其正在从现有的Amazon OpenSearch服务迁移到Atlas Search

在谈及迁移的驱动因素时,Basseri表示:“将数据库和搜索统一在同一个API有助于减少开发者的认知负荷,从而提高他们的工作效率,加快新功能的构建。这样可以消除了数据库和搜索之间同步数据带来的不便,从而缩短了工程周期。此外,这也意味着用户可以获得更好的体验,因为之前的延迟瓶颈已经消失,用户在Ferret平台上搜索联系人和内容时,可以得到最新的结果,而不是过时的数据。从OpenSearch迁移到Atlas Search还可以节省资金成本,并获得更多的灵活性。通过消除数据库和搜索引擎之间不必要的数据冗余,可将每月的总云成本减少30%。由于Atlas是支持多云的开发者数据平台,因此可以根据需要在多个云提供商之间迁移。”

迁移完成后,Basseri及其团队将能够使用Atlas Vector Search进行开发,并继续构建Ferret平台的GenAI功能。

从以上两个案例可以看出,无论企业目前处于AI发展的哪个阶段,MongoDB均可提供支持。如需了解更多信息,欢迎关注MongoDB微信公众号“MongoDB数据库”。