在华为开发者大会的热潮中,一场聚焦音视频AI多模态融合的高峰论坛吸引了众多目光。此次论坛以“媒体重塑行业数字化新价值”为主题,汇聚了华为云、引望、人形机器人(上海)有限公司、微赞直播及安朴酒店等多家行业领军企业,共同探讨AI多模态技术如何引领媒体、智能驾驶、具身智能、直播及酒店等领域的创新转型。
华为云媒体服务产品部总裁吕阳明在论坛上发表了开场演讲,他强调,随着人工智能向多模态融合迈进,音视频产业正步入智能化、个性化和互动化的全新阶段。为此,华为云构建了包含音视频处理、传输、建模、推理及渲染在内的五大能力引擎,并通过“AI for Media”与“Media for AI”的双向赋能,重新定义了AI时代的媒体生产力。
在“AI for Media”方面,吕阳明介绍了编解码与AI的结合,显著提升了画质,加速了超高清内容的普及。同时,渲染与AI的融合实现了个性化广告的“In-Scene”展示,而3DGS与AI的结合则能高效重建毫米级精度的3D数字空间。CG与AI的结合突破了数据泛化的瓶颈,为具身智能的训练效率带来了飞跃。
在智能驾驶领域,引望ADS云项目经理林凌分享了华为乾崑智驾与华为云音视频技术的协同创新成果。面对车载场景的复杂网络环境和高要求的数据安全监管,通过优化网络架构、应用弱网抗丢包算法以及业务分级传输等技术手段,实现了智能驾驶体验的显著提升。林凌强调,智能驾驶的发展趋势正从单车智能向多元协同转变,华为通过手机、车和云的协同,构建了强大的生态系统。
在具身智能领域,人形机器人(上海)有限公司的尹云鹏博士提出了“模型训推+操作系统+具身应用”的新开发范式。他介绍,国家地方共建人形机器人创新中心打造了全国首个虚实融合异构人形机器人训练场,并构建了虚拟仿真采集场,实现了训练数据的增广和仿真数据的高效生成。该中心还发布了全球首个百万量级、真实场景、异构机器人平台的高质量具身数据集“白虎数据集”,旨在以共性技术赋能人形机器人产业。
微赞直播副总裁何祖恒则分享了技术赋能直播营销的实践。他介绍,微赞依托华为云技术底座,打造了一站式私域直播解决方案,为企业数字化转型提供了创新路径与工具。该方案通过“低延时网络+AI媒体处理”的双向驱动,实现了高并发、超低延迟、高清流畅且安全可靠的直播服务体系。AI媒体转码结合音视频大模型,自动优化画质,提升了直播的效率和呈现效果。
在酒店行业,安朴酒店管理有限公司IT总监孙海龙分享了酒店数字化的新趋势和实践经验。他提到,宾客数字化体验已成为酒店行业数字化的首要目标。安朴酒店通过引入智能交互数字人管家,打造了酒店行业的AI创新。数字人管家不仅提升了服务效率,还为宾客带来了不一样的入住体验。孙海龙总结道,数字人不仅是工具,更是酒店的情感连接器,为酒店行业的数字化升级提供了可借鉴的范本。