豆包大模型1.8发布：强化图像理解与“记性”，向通用Agent迈进

时间：2025-12-19 08:09:18 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在火山引擎的FORCE大会上，豆包团队发布了全新基础模型——豆包大模型1.8，引发业界广泛关注。这款模型不再局限于传统聊天功能，而是将目标直指通用型真实世界代理，试图在AI应用领域开辟新赛道。

技术报告显示，豆包团队在基础能力测试中展现出难得的务实态度。面对编程、数学推理等专项领域，新模型虽未超越谷歌Gemini 3-Pro等行业标杆，但在综合应用能力测试中实现突破。特别是在代理能力评估环节，豆包在任务执行、信息检索等实用场景中表现优异，甚至在英文资料搜集能力上超越多家国际竞品。

实际测试环节验证了模型的应用潜力。通过接入Agent TARS框架，豆包1.8成功完成多邻国打卡、新闻摘要生成等复杂任务。在多邻国测试中，模型不仅能自主导航至目标网站，还能通过屏幕识别完成听力题作答，整个过程持续16分钟且后台运行不影响其他操作。这种多任务处理能力，标志着AI代理向实用化迈出关键一步。

技术突破体现在三大核心升级。首先是视觉理解能力的质的飞跃，新模型支持同时处理搜索、代码执行和界面交互，形成完整的数据闭环。其次，记忆能力显著增强，通过帧率优化可连续理解一小时内的屏幕操作，配合视频分析工具实现精准内容定位。第三，指令理解能力突破传统数据局限，在反直觉测试中展现出超越GPT的逻辑推理水平。

兼容性测试数据印证了模型的工程化优势。在Trae、Claude Code等不同框架下，代码通过率稳定在64.8%-72.9%区间，展现出跨平台适应能力。这种特性使模型能无缝嵌入各类工作流，为企业级应用奠定基础。实际案例中，模型已能准确识别电脑型号、查询存储空间等基础信息，并通过命令行完成复杂操作。

市场数据印证了用户需求转向。豆包大模型日均处理量达50万亿tokens，较首发时激增417倍。这种爆发式增长背后，是各行业对实用型AI的迫切需求。从自动打卡到新闻摘要，从设备管理到数据分析，用户期待AI能真正解决实际问题，而非停留于概念演示。

技术路线分歧日益显现。不同厂商对AGI实现路径存在显著差异：Anthropic押注代码生成，DeepSeek专注数学突破，谷歌强调视觉理解，而豆包选择代理能力作为突破口。这种差异化竞争或将推动AI技术加速分化，形成多元发展格局。

当前AI发展呈现明显实用化倾向。用户不再满足于模型的基础能力比拼，更关注其在真实场景中的落地效果。豆包1.8的发布，恰好契合这种市场转向，其通过强化代理能力构建的技术壁垒，可能成为打开企业级市场的关键钥匙。随着各家技术路线逐渐清晰，AI领域的军备竞赛正进入深水区。

天眼查工商信息显示，近日，有品信息科技有限公司发生工商变更，黎万强、洪锋退出股东行列，注册资本由5000万人民币减至4000万人民币，同时，部分高管发生变更。有品信息科技有限公司成立于2018年4月，法定代…

孙虎系统阐释山水三境创新模型：第一境“山水智境”，以AI与数字化技术赋能设计研发，携手百度等科技企业探索工业化建造路径；第二境“山水情境”，聚焦文化与自然的情感设计，以“场景替代产品”营造沉浸式人居体验；第…

谷歌提供四个不同版本的Gemma 4模型，它们的区别在于参数数量。 A：Gemma 4在Apache2.0许可证下发布，模型权重可通过Hugging Face、Kaggle和Ollama平台获取，用户可以…

从稚晖君到YeoHuiShyong，已有8位华为天才少年转战具身智能领域，他们集体转型的背后，折射出一个颠覆性趋势：机器人行业正在形成强大的人才虹吸效应。这些天才少年在华为积累的技术经验，成为他们转型的关键…

1、马斯克表示，Optimus3有望在今夏启动生产，并在2027年实现大规模量产，并宣布特斯拉正式停产Model S和Model X两款车型，目前已停止接受新车定制订单，消费者只能购买库存现车。在机器人系统…

根据灼识咨询报告，2025年以销售量计，公司在中国前五大柔性协作机器人和前五大轻负载工业机器人供应商中均排名第一，市场份额分别为47%和5.8%；同时，珞石多关节机器人在国内制造商中排名第三，在全球制造商中…

中国信息通信研究院云计算与数字化研究所副所长栗蔚：Token已经成为AI产业的重要度量衡，Token的消耗总量体现了智能体等创新AI应用的运用深度和广度，Token成本则体现了算法算力的效率。中国信息通…

4月3日消息，谷歌推出Gemma 4开源大模型，为其迄今最智能的开源模型系列，主打高级推理与智能体工作流，拥有领先的单位参数智能水平。据了解，该模型共推出四款规格，包括20亿参数E2B、40亿参数E4B、2…

在谷歌迄今为止所有的模型中，Gemma 4是目前最强大的开放权重模型系列，继承了前沿多模态、长上下文和高级推理能力，被谷歌官方称之为是“在逐字节比较下性能最强的”开放模型（Bytefor byte, th…

在科技飞速发展的今天，AI正逐渐融入我们的生活和工作。3月17日，科大讯飞股份有限公司带来了重磅消息----基于AstronClaw打造的桌面AI助理Loomy正式发布，为本地办公场景带来了全新的变革。Loo…

4月3日，内容赛道风云再起。抖音与小红书不约而同地在App搜索页面嵌入了“提问”功能，标志着两大流量巨头正式向知乎的传统腹地发起冲击。用户在搜索无果时，可直接发布图文问题求助，系统将通过算法将问题精准分发给…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.