Kakao Mobility 是韩国领先的出行服务企业,通过 Kakao T 应用提供一系列交通和配送服务,包括叫车、导航、自行车和滑板车共享、停车和包裹配送。Kakao Mobility 的团队利用 Gemini Nano 通过 ML Kit 的生成式 AI Prompt API 为其共享单车服务提供停车辅助功能,并为其导航和配送服务提供改进的地址输入体验。
Kakao T 应用的总用户数超过 3, 000 万,其共享单车服务是最受欢迎的服务之一。但遗憾的是,许多用户在不使用自行车或滑板车时,会将其停放在不当的位置。这种行为导致违规停车情况激增,引发了安全问题,导致公众投诉、罚款和拖车。这些问题开始对 Kakao Mobility 及其共享单车服务的公众认知产生负面影响。
“通过利用 ML Kit 的 GenAI Prompt API 和 Gemini Nano,我们能够快速实现可提升社会价值的功能,同时不会影响用户体验。Kakao Mobility 将继续积极采用设备端 AI,以提供更安全、更便捷的出行服务。” - Wisuk Ryu,客户端开发部门主管
为了解决这些问题,该团队最初设计了一个图像识别模型,用于在用户根据当地法律和安全标准正确停放自行车或滑板车时通知用户。通过云运行此模型会产生高昂的服务器费用。此外,用户上传的照片包含有关其停车位置的信息,因此该团队希望避免任何隐私或安全问题。该团队需要找到一种更可靠且更具成本效益的解决方案。
该团队还希望改进 Kakao T 应用内包裹递送服务的实体提取体验。之前,用户可以在聊天界面上轻松订购包裹递送服务,但司机需要手动将地址输入到订单表单中才能发起递送订单,这个过程非常繁琐,而且容易出现人为错误。该团队力求简化此流程,让送货人员能够更快速、更轻松地填写订单表单。
使用机器学习套件的生成式 AI Prompt API 提升用户体验
该团队测试了基于云的 Gemini 模型,并将其与通过 ML Kit 的 GenAI Prompt API 访问的 Gemini Nano 进行了比较。“在评估了隐私权、费用、准确性和回答速度后,我们发现 ML Kit 的生成式 AI Prompt API 显然是最佳选择。”Kakao Mobility 的 Android 应用开发者 Jinwoo Park 说道。
为了解决自行车或滑板车停放不当的问题,该团队通过 ML Kit 生成式 AI API SDK 使用 Gemini Nano 的多模态功能来检测自行车或滑板车是否因停放在黄色盲道上而违反当地法规。通过精心设计的提示,他们能够评估 200 多张带标签的停车照片,同时不断优化输入内容。此评估通过准确率、精确率、召回率和 F1 得分等知名指标进行衡量,确保该功能达到生产级质量和可靠性标准。
现在,用户可以拍摄停放的自行车或滑板车的照片,应用会告知他们是否停放得当,如果停放不当,则会提供指导。整个流程在设备上只需几秒钟即可完成,可保护用户的位置和信息。
为了打造简化的实体提取功能,该团队再次使用 ML Kit 的 GenAI Prompt API 来处理用户以自然语言撰写的送货订单。如果他们采用的是传统机器学习,则需要庞大的学习数据集和机器学习方面的专业知识。相反,他们可以简单地从“从消息中提取收件人的姓名、地址和电话号码”之类的提示开始。该团队准备了大约 200 个高质量的评估示例,并通过多轮迭代评估提示,以获得最佳结果。我们采用的最有效的方法是一种称为“少样本提示”的技术,并仔细分析了结果,以确保输出内容中的幻觉最少。
“ML Kit 的 Prompt API 可减少开发者的开销,同时在设备端提供强大的安全性和可靠性。它支持快速原型设计,降低了对基础设施的依赖性,并且不会产生额外费用。没有理由不推荐它。” - Jinwoo Park,Kakao Mobility 的 Android 应用开发者
使用机器学习套件的生成式 AI 提示 API 取得出色成果
因此,即使输入了多个名称和地址,实体提取功能也能正确识别每个订单的必要详细信息。为了尽可能扩大该功能的覆盖面并提供可靠的后备方案,该团队还使用 Gemini Flash 实现了基于云的路径。
通过改用设备端 AI,Kakao Mobility 团队在实现 ML Kit 的 GenAI Prompt API 后节省了大量成本。虽然自行车停放分析功能尚未发布,但地址输入改进功能已取得了出色的成效:
- 外送订单的完成时间缩短了 24%。
- 新用户的转化率提高了 45%,现有用户的转化率提高了 6%。
- 在旺季,AI 赋能的订单数量会增加 200% 以上。
Wisuk 补充道:“尤其是小型企业主,他们分享了非常积极的反馈,表示这项功能让他们的工作效率大大提高,压力也显著减轻。”
在推出自行车和滑板车停放位置的图像识别功能后,Kakao Mobility 团队渴望进一步改进该功能。城市停车环境可能非常复杂,因此团队正在探索从图片中滤除不必要区域的方法。
“ML Kit 的生成式 AI 提示 API 可提供高质量的功能,而不会增加额外的开销。”Jinwoo 说道。“这减少了开发者的工作量,缩短了总体开发时间,并使我们能够专注于提示调整,以获得更高质量的结果。”
亲自试用 ML Kit 的 GenAI Prompt API
使用 ML Kit 的生成式 AI Prompt API 在应用中构建和部署设备端 AI,以充分利用 Gemini Nano 的功能。
继续阅读
-
案例研究
Karrot 是一款由社区驱动的超本地化点对点交易应用,可让用户与其他经过验证的用户买卖和交易商品。自 2015 年在韩国推出以来,该平台已扩展到全球市场,注册用户总数超过 4,300 万。
Thomas Ezan, Tracy Agyemang • 阅读用时:2 分钟
-
案例研究
Monzo 是一家英国数字银行,拥有 1,500 万客户,并且客户数量还在不断增长。随着应用规模的扩大,工程团队发现应用启动时间是一个需要改进的关键领域,但担心这需要对代码库进行重大更改。
Ben Weiss • 阅读用时:2 分钟
-
案例研究
TikTok 是一个全球性的短视频平台,以庞大的用户群和创新功能而闻名。
Ben Trengrove, Ajesh Pai • 阅读用时:2 分钟
随时了解最新动态
每周通过电子邮件接收最新的 Android 开发洞见。