近日,阿里巴巴集团内的两大科技力量——高德地图与通义千问实验室携手宣布了一项创新合作成果。这一成果体现在高德地图即将发布的2025版本中,该版本将首次推出全球领先的AI原生出行智能体。
这款智能体实现了语音与文本的全方位交互能力,得益于双方共同研发的先进语音系统。该系统覆盖了从唤醒、识别到理解、播报的整个流程,并运用全双工技术,使得用户可以在任何时刻打断对话,同时能够在复杂的声学环境中有效抵抗回声干扰。智能体整合了高德导航专用的语音识别模型、通用大型语音识别模型以及综合理解模型,能够应对导航需求、本地生活服务查询以及日常对话等多种场景。
在技术支持方面,通义千问实验室的大模型底座成为了智能体的核心驱动力。特别是Qwen3,这款预训练模型处理了约36万亿个数据单元,为智能体提供了强大的空间感知和行为认知能力。值得注意的是,Qwen系列模型在Hugging Face等平台上广受欢迎,下载量超过4亿次,衍生出了超过14万个定制模型。高德地图通过特定的指令微调,进一步增强了该模型在出行相关场景中的语义理解和响应效率。
在智能体的架构设计方面,双方基于高德地图的DeepResearch框架,开发了专门的POI(兴趣点)推理智能体。这一智能体能够解析用户的时空需求以及多重约束条件,自主调用地图API、实时天气和交通数据工具,从而完成诸如多兴趣点路线规划、实时约束条件下的推荐等复杂任务。
此次合作展示了“模型+场景”深度融合的新路径。通义千问实验室提供了强大的大模型基础能力,而高德地图则贡献了丰富的空间场景数据和工具生态。这种合作模式不仅推动了高德地图向“理解世界”的方向迈进,也为通义大模型在消费者端场景的规模化应用提供了宝贵的落地机会。这一创新实践或许将为AI技术的跨界应用探索出一条新的道路。