近期,阿里巴巴集团内部两大巨头——高德地图与通义实验室携手共进,在高德地图2025版中推出了一系列创新合作成果,标志着AI原生时代的又一重要里程碑。
此次合作聚焦于语音交互、大模型能力及智能代理(Agent)三大核心领域,共同推动高德地图从简单的“连接世界”向更高级的“理解世界”迈进。
在语音交互方面,高德地图2025版引入了业内首个专为出行生活设计的智能体“小高老师”。这一创新智能体能够通过音频、文本等多种方式与用户进行直观互动,提供前所未有的交互体验。高德与通义实验室的语音团队通力合作,构建了从唤醒、识别到理解和播报的全链路语音能力,使得“小高老师”的识别精度和交互流畅度均达到了行业领先水平。
双方还共同打造了一套新一代语音语义感知系统,该系统集成了高德导航专用语音识别模型、通用领域大模型语音识别能力以及高德大模型的综合理解能力,全面覆盖导航、本地生活服务和日常闲聊三大应用场景。全双工语音技术的应用让用户能够随时打断“小高老师”并发出新指令,而抗回声处理则确保了在复杂声学环境下也能保持清晰、流畅的交互。
在大模型能力方面,高德与通义实验室共同构建了大模型簇,这一模型簇由多模态空间感知、行为认知、时空意图理解、总结输出交互和反馈观测评估等多个专业模型组成。通义实验室的Qwen大模型系列,凭借其全球领先的预训练规模和语义理解能力,成为此次合作的坚实底座。Qwen2.5已在18万亿token上完成预训练,而Qwen3的数据量更是达到了约36万亿token,进一步提升了模型的泛化能力。
基于Qwen模型的底座能力,高德通过指令微调(SFT)训练,显著增强了其在出行生活场景中的语义理解、上下文感知与响应能力。这一提升使得高德地图能够更好地理解用户的复杂需求,并提供更加精准的服务。
在智能代理(Agent)领域,高德与通义实验室联合开发了地图领域的复杂POI推理Agent。这一智能代理能够深入理解多重约束条件,有效利用地图和搜索工具,以及整合实时联网信息,为用户提供精准的POI推荐与导航服务。该Agent基于高德自研的DeepResearch框架构建,融合了强大的规划、反思和工具调用机制,能够智能拆解复杂任务、评估执行路径并高效协调各类工具。
这一创新智能代理具备三大核心能力:首先,它拥有地图领域领先的多维POI推理能力,能够理解和处理复杂时空需求以及复杂POI;其次,它预置了专属地图API、实时天气查询、交通状况监测等工具,并能自主调度相关工具以适应不断变化的场景需求;最后,它能够处理复杂场景下的POI任务,如多POI路线规划、实时约束下的POI推荐等。
此次高德与通义实验室的合作,不仅是技术能力的叠加,更是生态协同共建的深度实践。通义大模型的泛化能力与高德在空间场景上的深度积累相结合,在AI原生地图中实现了前所未有的深度融合。这一合作不仅推动了高德地图APP的迭代升级,更为智能汽车、智能眼镜、具身智能、低空飞行等领域的变革提供了强大动力。
同时,通义实验室也通过高德地图这一海量用户场景,推动了大模型能力的真实落地与验证,加速了其在C端产品中的规模化应用。这一合作模式有望成为“模型+场景”跨域融合的行业范式,为AI能力在更多真实世界场景中的落地提供宝贵的实践经验。