滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

百度智能云携手昆仑芯与HAMi，双模式调度让国产AI算力高效利用

时间：2025-11-03 18:01:23 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

在国产AI算力调度领域，百度智能云混合云携手HAMi开源项目与昆仑芯，共同推出了一项突破性技术方案——基于昆仑芯P800的XPU/vXPU双模式算力调度体系。该方案已成功应用于某金融客户的核心业务集群，为智能客服、营销辅助等十余类AI场景提供算力支撑，实现了资源利用率与业务适配性的双重提升。这一创新标志着国产AI硬件在复杂业务场景下的调度能力迈入新阶段。

方案的核心在于构建了“XPU整卡+vXPU虚拟化”的双轨调度机制。针对大规模训练场景，XPU整卡模式通过拓扑寻优调度与集群健康度评估，实现了“多卡单任务”的最优资源分配。系统会自动识别昆仑芯服务器的物理分区结构，优先在单侧翼内调度资源，减少跨分区通信开销；同时评估节点拓扑规整度，选择对整体结构影响最小的节点进行分配，避免资源碎片化。这种设计使得运维团队无需手动拼卡，即可保障大模型训练的通信稳定性，资源利用率提升30%以上。

在推理、开发测试等轻量化场景中，vXPU虚拟化模式则展现了其灵活性。该模式支持将单张昆仑芯P800显卡切分为1/4卡（24GB显存）或1/2卡（48GB显存）两种规格，用户仅需声明所需显存，系统会自动匹配最优切分方案。例如，申请20GB显存时，系统会直接分配24GB规格，省去手动换算步骤。为避免实例间干扰，方案还引入了“同规格共享”机制，确保同一物理卡仅运行相同规格的虚拟实例，大幅简化了资源隔离与管理流程。

针对灰度测试、硬件故障复现等特殊场景，方案设计了“自动化调度+人工干预”的混合模式。运维人员可通过指定物理卡的UUID，直接选定或排除特定卡片进行调试。例如，在新模型灰度发布时，无需调动全量资源，仅需指定部分卡片即可完成验证；硬件故障排查时，也能精准定位问题卡片，无需整机下线。这种设计既保障了日常调度的效率，又为复杂场景提供了灵活的管理手段。

该金融客户的应用实践显示，双模式调度方案显著提升了业务响应速度。在智能客服场景中，vXPU模式使单卡可同时支持8个并发推理任务，响应延迟降低至50ms以内；在大规模训练场景中，XPU模式的拓扑优化使千卡集群的训练效率提升15%，资源利用率达到92%。客户技术负责人表示：“这一方案让我们在国产算力上实现了‘重场景用整卡、轻任务用虚卡’的精准匹配，真正做到了算力‘物尽其用’。”

此次合作不仅是技术层面的突破，更验证了开源生态与企业服务结合的落地能力。HAMi作为CNCF开源项目，其调度框架为方案提供了底层支持，而百度智能云的混合云架构则实现了与金融行业IT系统的深度适配。昆仑芯P800作为国产AI芯片的代表，通过双模式调度方案，进一步证明了其在多元业务场景中的通用性。这一实践为国产AI硬件的规模化应用提供了可复制的路径，也为行业树立了技术创新的标杆。

更多>同类资讯

AI冲击谷歌搜索与广告？数据揭晓：谷歌市场回暖，AI助力精准变现

哈喽，大家好，小圆这篇国际评论，主要来分析一个曾让科技圈热议的话题：ChatGPT横空出世时，所有人都以为谷歌搜索这个摇钱树要被AI掀翻，但最新数据却狠狠打脸，谷歌搜索市场份额重回90%，广告业务连续两个季度…

12-17

谷歌联合创始人布林反思：错失Transformer先机，未来看好材料科学

即便是在 AI 领域，我们也会持续关注斯坦福等高校的研究，偶尔招聘一些研究人员，或者展开合作。如果你提出了一种完全不同于主流路线的新方法 —— 比如既不是我们在做的超导量子比特，也不是很多初创公司在尝试的离…

12-17

2025B站跨年夜升级来袭！线上线下共赏多元盛宴迎新年

零点时分，跨年直播将上线定制烟花弹幕功能，用户发送的每一条弹幕都将化作绚烂的“赛博烟花”在屏幕绽放；与此同时，线下将同步发射万发心愿烟花，搭配精彩的无人机编队表演，营造新年氛围感。除核心晚会内容外，B站还联…

12-17

2026小红书营销IP矩阵揭秘：多场景覆盖，助力品牌长效增长新路径

营销IP以“社区原生洞察+高质UGC井喷+阵地聚合+互动体验激发+心智沉淀”为核心逻辑，形成“内容-趋势-商业”的高效通路，覆盖大事件营销、新品营销、节点营销、互动营销等四大核心类型，同时针对美尚、服饰潮流、…

12-17

Meta CTO回应VR传闻：VR未死，削减预算或因市场增速未达预期

我们也在眼镜和AI领域投入巨资，这才是关键所在。我们可以投资VR、眼镜和人工智能——顺便说一句，我们已经这样做了很多年。基于本次回应我们可以看到，虽然Bosworth说得很委婉，但也变相证实了VR团队削减预算…

12-17

2025小红书小马生活节：三城联动，以City Walk解锁城市美好新体验

今天分享的是：《2025小红书马路生活节设计方案》围绕“Joy is nearby”核心主题，打造了一场聚焦城市漫步体验的特色活动，活动时间定于9月26日至10月12日，覆盖上海、杭州、广州三座核心城市，旨…

12-17

字节跳动推出Seedance 1.5 pro模型：多语种音视频同步生成新突破

该模型支持从文本或图像生成带有同步音频的视频，实现了音视频的联合生成。据介绍，Seedance 1.5 pro在音画同步方面进行了优化，旨在提升生成内容中口型、语调与表演节奏的一致性。模型支持包括中文、英文…

12-17

苹果新品大曝光！折叠屏iPhone、AR眼镜等数十款设备研发中

12-17

特斯拉股价创近一年新高，得州启动自动驾驶出租车无乘客测试

12-17

人形机器人“抢镜”春晚：营销热潮下，商业化之路仍漫漫

12-17

抖音发布社区财经行业公约：规范财经内容传播明确账号资质要求

12-17

OpenAI参投的Chai Discovery获1.3亿美元B轮融资加速AI药物设计研发

12-17

AI健康管理新突破 “蚂蚁阿福”App月活超1500万登总榜第三

封面新闻记者张越熙 AI健康应用正从“辅助工具”走向“主动健康管理”，这促使AI健康应用迎来爆发式增长。12月16日，蚂蚁集团旗下AI健康应用“蚂蚁阿福”昨日发布后下载量猛增，今日冲上苹果应用榜总榜第三位。…

12-17

豆包手机助手及合作机型重启F码候补申请，少量名额优先爱好者

IT之家 12 月 16 日消息，根据中兴商城官网显示，豆包手机助手及合作机型 nubia M153 目前已重启 F码候补申请通道，正式恢复产品购买资格。据 nubiaM153 F 码发放前置信息收集表显…

12-17

字节跳动Seedance 1.5 pro模型登场，音视频协同创作开启新体验

在 Seedance 1.0 版本中，模型更侧重改善模型表现的“下限”，优化了运动生成的稳定性；而 Seedance 1.5 pro 除了支持音频同步生成外，还致力于提升视觉冲击力和运动效果的“上限”。通过…

12-17

点击查看更多 +

全站最新

周鸿祎严正声明：玉红恶意诋毁 360将依法追究法律责任

2025年AI数字人生态：虚拟人格安全边界与攻防策略全解析

字节跳动推出Seedance 1.5 pro模型：多语种方言支持音视频同步生成再升级

杭州数字文旅AI智能原生十大场景应用揭秘，解锁文旅新玩法！

万宁中国内地市场大调整：线下门店及多平台线上商城将陆续停运

小红书2026双旦营销：以“小跨越”为名，打造品牌与用户的情感共鸣盛宴

热门内容

本栏最新

周鸿祎严正声明：玉红恶意诋毁 360将依法追究法律责任

2025年AI数字人生态：虚拟人格安全边界与攻防策略全解析

字节跳动推出Seedance 1.5 pro模型：多语种方言支持音视频同步生成再升级

杭州数字文旅AI智能原生十大场景应用揭秘，解锁文旅新玩法！

万宁中国内地市场大调整：线下门店及多平台线上商城将陆续停运

小红书2026双旦营销：以“小跨越”为名，打造品牌与用户的情感共鸣盛宴

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.