滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

豆包入驻浦东美术馆：AI导览开启逛展新篇多模态技术赋能人文体验

时间：2026-01-21 01:18:46 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在博物馆与美术馆的参观场景中，人工智能技术正以全新形态融入公众文化生活。字节跳动旗下豆包与上海浦东美术馆达成合作，成为"图案的奇迹"与"非常毕加索"两大国际展览的官方AI讲解员。这项创新应用通过视频语音交互技术，将传统观展模式升级为个性化深度体验，观众可随时获取艺术作品的多维度解读。

技术团队针对博物馆场景的特殊性，重点突破了三项技术瓶颈：通过独家数据合作提升文物识别精度，运用定向搜索优化解决小众展品信息缺失问题，并开发稳定识别算法应对不同观测角度的动态挑战。基于Seed1.8通用Agent模型的视频理解能力，AI讲解系统已实现从感知到推理再到交互的完整闭环，能够根据观众提问即时生成专业解析。

在"非常毕加索"展厅的实测中，当观众询问《阅读》画作氛围营造手法时，AI系统不仅解析了1932年创作背景下的色彩运用技巧，还结合毕加索与缪斯玛丽–特蕾兹的情感关系，阐释了具象与变形之间的艺术平衡。这种共情式对话设计，通过唤醒观众已有认知，构建起更具参与感的理解路径。

多模态技术发展正推动AI应用进入新阶段。火山引擎总裁指出，当前AI系统需要处理大量视觉化输入输出，在工业质检、智能驾驶等场景中，模型必须具备跨模态理解能力。这种技术演进使AI导览员能够同时处理图像、语音、文字等多类型信息，为观众提供立体化服务。

行业观察显示，多模态与世界模型的技术融合成为新趋势。中科院自动化研究所与CreateAI联合推出的NeoVerse，以及爱诗科技发布的PixVerse R1通用实时世界模型，标志着技术发展进入新阶段。这些系统通过预训练与仿真技术构建虚拟环境模型，为AI提供多模态交互的基础能力。

字节跳动研发团队将世界理解能力嵌入通用大模型体系，Seed系列模型通过叠加感知、推理、动作能力，逐步形成"建模-交互-执行"的技术闭环。官方定义的世界模型，强调对物理世界规律的建模能力，包括重力、摩擦力等基础物理特性的理解，这为具身智能发展奠定基础。

技术落地面临多重挑战。当前多模态模型仍存在理解与生成割裂的问题，多数系统采用组合式架构，记忆机制与跨模态对齐能力有待完善。创新奇智CTO张发恩指出，物理AI的发展方向倒逼世界模型研发，通过自动生成多模态训练数据，降低视觉语言动作模型的研发成本。

行业共识逐渐形成：多模态与世界模型将走向融合。智源研究院院长王仲远预测，随着技术路线收敛，未来将出现统一的多模态世界大模型。这种发展态势在谷歌Gemini3等原生多模态模型中已现端倪，其图片编辑功能展示了理解与生成一体化的可能性。

商业化进程仍受制于技术成熟度。当前系统在时空一致性整合、因果逻辑对齐等方面存在不足，高昂的研发成本也限制了应用普及。行业正通过可实现的智能路径探索，逐步明确通向通用人工智能的技术方向，在功能模仿与规律理解之间寻找平衡点。

智东西7月3日报道，在2026亚马逊云科技中国峰会期间，作为国内大模型企业代表，月之暗面Kimi B端负责人黄震昕分享了与亚马逊云科技的合作进展，并透露月之暗面“提供给研发人员的是行业内最高的人均算力支持”…

07-08

传DeepSeek正自主研发人工智能芯片

07-08

雷军：小米捐赠1000万紧急驰援广西等地救灾

07-08

泡泡玛特捐赠1000万元人民币，驰援救灾一线

07-08

智谱紧急澄清：撤回A股辅导备案失实

近日，有媒体报道称智谱撤回A股IPO辅导备案，引发市场关注和热议。对此，智谱迅速作出回应，明确表示相关报道与事实不符，并质疑有关内容存在恶意炒作嫌疑。智谱还称，公司建议A股发行方案已于公司2026年6月22日召开的2025年年度股东会上经公司股东审议及批准。根据中国

07-08

继华为、小米之后，荣耀也要做自己的输入法了

7月7日，根据荣耀官网最新招聘信息显示，荣耀终端有限公司已启动“输入法Android开发专家”岗位招聘，计划从底层自研一套完整的Android手机输入法系统。从岗位职责来看，该职位将负责输入法多个核心模块的研发，包括端侧UI/UX交互框架、输入引擎、语音输入、键盘输入、

07-08

2纳米新机一加16来袭！骁龙8E6 Pro+2亿像素+9000mAh，配置超猛

今年的骁龙8E Gen6属于大更新，不仅工艺升级到了台积电2纳米，更是首次分为标准版和Pro版，而两者性能相差并不小。最知名的当然是小米18Pro Max，而近日另一款骁龙8E6 Pro机型也浮上水面，它…

07-08

一加16配置曝光：2纳米芯+2亿主摄+9000mAh，或成小米18 Pro Max强劲对手

今年的骁龙8E Gen6属于大更新，不仅工艺升级到了台积电2纳米，更是首次分为标准版和Pro版，而两者性能相差并不小。最知名的当然是小米18Pro Max，而近日另一款骁龙8E6 Pro机型也浮上水面，它…

07-08

特斯拉2025影响力报告：减排储能双突破，自动驾驶与人形机器人加速落地

07-08

小米汽车新品牌SkyNomad官宣，中文名或为寻天，首款SUV计划2026年上市

07-08

小米增程车上市在即：7月底技术发布 8月中下旬交付昆仑N3谍照引关注

07-08

高盛首评SpaceX：垂直整合战略撬动航天、互联与AI三大万亿市场

07-08

95后瑞幸超级加盟商“急刹车”：转战小餐，背后有何经营智慧？

07-08

2026年AI新局：免费时代终结，“付费算力”成职场竞争新门槛

如果你觉得这仅仅是远在硅谷的 OpenAI “吃相难看”，那最近国内 AI 圈的一枚重磅炸弹，绝对能把你彻底炸醒：一直以“免费、亲民、无限畅聊”为最大卖点的字节跳动旗下大模型“豆包”，也正式开启了核心功能的…

07-08

全球顶级富豪齐聚太阳谷闭门峰会，私人飞机挤满小镇机场

07-08

点击查看更多 +

全站最新

92号与95号汽油怎么选？5个关键真相揭秘，车主必看避免踩坑多花钱

新款宝马X2谍照曝光！外观内饰升级，燃油纯电双版本2027年将至

享界G9前瞻：全系华为自研电机加持，标配四驱续航超1300公里

保时捷应对市场挑战：多地门店经销业务调整，售后仍保高品质服务

跳出同质化模板：银河TT以独特内饰设计展现新能源新思路

广汽本田长春鼎泓成邦店盛大开业携手开启汽车服务新篇章

热门内容

本栏最新

特斯拉2025影响力报告：减排储能双突破，自动驾驶与人形机器人加速落地

小米汽车新品牌SkyNomad官宣，中文名或为寻天，首款SUV计划2026年上市

2026年AI新局：免费时代终结，“付费算力”成职场竞争新门槛

吉利银河TT首发亮相，外观动感内饰新，价格亲民或成爆款新选择

启源Q06宣传海报引争议，新能源车企营销如何走出“撞脸”困局？

吉利银河TT首发亮相，内饰智驾升级，定价亲民或成爆款新选择

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

豆包入驻浦东美术馆：AI导览开启逛展新篇 多模态技术赋能人文体验

豆包入驻浦东美术馆：AI导览开启逛展新篇多模态技术赋能人文体验