ITBear旗下自媒体矩阵:

阿里“零搜索”技术革新AI训练,成本大降八成,精度超越谷歌

   时间:2025-05-09 22:02:53 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在AI技术的前沿探索中,阿里巴巴达摩院近期公布了一项名为“零搜索”的突破性技术,该技术有望彻底改变AI模型的训练成本问题。5月7日,阿里巴巴达摩院在arXiv平台上发布的一篇论文详细阐述了这一创新。

据悉,“零搜索”技术通过模拟搜索引擎的训练机制,使得大型AI模型无需依赖真实的搜索引擎API,即可自主发展出强大的检索能力。这一技术的问世,打破了长久以来对科技巨头API服务的依赖,为开发者提供了前所未有的数据质量控制手段。

阿里巴巴达摩院的研究团队指出,“零搜索”技术已经面向公众开源,代码已上传至GitHub和Hugging Face平台,并支持包括Qwen-2.5、LLaMA-3.2在内的主流模型架构,既适用于基础版模型,也适用于经过指令微调的版本。尤为初创企业仅需配备四块A100显卡,即可搭建起高精度训练环境。

在综合测评中,“零搜索”技术展现出了惊人的表现。研究团队在NQ、TriviaQA、PopQA、HotpotQA等七大主流问答数据集上进行了测试,结果显示,基于“零搜索”技术训练的140亿参数大模型,在搜索准确率上超越了谷歌,同时训练成本降低了近九成。这一成绩,无疑是对传统AI训练模式的一次重大颠覆。

具体成本节约方面,据VentureBeat报道,原本需要花费586.70美元(约合人民币4240.74元)调用商业搜索引擎API的训练任务,现在仅需70.80美元(约合人民币510.17元)即可完成。这意味着,开发者可以节省高达88%的成本,同时获得与商业搜索引擎相媲美甚至更优的检索能力。

阿里巴巴的研究团队进一步发现,经过海量预训练的大型模型已经具备了生成拟真文档的能力。通过监督微调,这些大语言模型可以被转化为检索模块,按需生成相关或无关的文档组合。在强化学习阶段,系统通过逐步降低生成文档质量的“教学策略”,迫使模型不断优化检索精度,从而形成一个自主进化的闭环。

在TriviaQA等七大主流问答数据集的测试中,“零搜索”技术展现出了强大的实力。基于通义千问2.5、LLaMA3.2等架构的模型在数学视觉推理测试中得分超过了OpenAI的模型,展现出了卓越的图形与数学结合分析能力。特别是在事实准确性指标上,140亿参数模型超越了谷歌搜索2.3个百分点,而70亿参数模型则与商业搜索引擎持平。在相同的训练量下,模拟方案较谷歌搜索API节省了88%的开支。

阿里巴巴达摩院的这一突破,不仅有望大幅降低AI模型的训练成本,还可能对AI开发价值链产生深远影响。随着自模拟技术的不断成熟,未来或将涌现出更多创新的AI训练方案,推动整个产业进入低成本、自主进化的新阶段。这一技术的问世,无疑为AI技术的未来发展开辟了新的道路。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version