稀宇科技近日宣布,其新一代旗舰模型MiniMax M2.5已正式开源发布。该模型在编程开发、工具调用及办公生产力领域取得关键技术突破,为行业应用带来全新可能。此次开源不仅提供了模型架构,还包含完整的部署指南与参数配置参考,开发者可通过公开渠道获取相关资源。
华为昇腾团队迅速响应,在模型开源后数小时内完成与昇腾Atlas 800 A2/A3全系列硬件的适配部署。通过AI基础软硬件与AI Agent技术的深度融合,该方案已在多个现网环境中开展试点应用,为模型规模化落地提供从算力支撑到优化部署的全流程解决方案。这种高效协作模式显著缩短了技术转化周期,为行业树立了跨平台适配的新标杆。
技术实现层面,华为昇腾采用TP+EP混合并行策略,原生支持192K上下文长度处理能力。这一特性使模型在分析代码仓库等复杂场景时无需进行数据截断,完整保留上下文信息。通过ACLGraph加速引擎、Expert Parallel调度机制及FlashComm1通信优化技术,多卡并行效率得到显著提升。特别值得关注的是,FP8权重原生加载功能的实现,允许用户直接部署官方预训练权重,大幅降低模型部署门槛。
在专业场景验证中,MiniMax M2.5展现出卓越性能。金融建模、文档处理等领域的实测数据显示,其平均任务胜率达到59.0%。该模型具备架构师级编程思维,能够在编码前自主完成功能拆解、系统架构设计与用户界面规划。支持Go、C++、Python等超过10种编程语言,可独立完成从系统设计、开发到测试的全流程工作,覆盖Web、Android、iOS等多平台全栈项目开发需求。
工具调用与信息检索能力方面,模型通过优化决策逻辑实现效率跃升。在BrowseComp、Wide Search等真实专家级搜索任务中,M2.5相比前代版本M2.1减少约20%的搜索轮次消耗,同时保持更高的token利用率。这种改进不仅体现在任务完成速度上,更通过更精准的路径规划提升结果质量,在RISE评测体系中获得权威认可。
办公场景应用测试表明,该模型可直接生成专业级成果。在金融建模、文档排版、数据分析等高复杂度任务中,其输出质量达到行业专家水平。这种能力突破使模型不再局限于辅助工具角色,而是能够作为独立生产力要素参与核心业务流程。开发者社区现已开放模型部署技术文档与启动参数配置指南,为不同场景的定制化开发提供完整支持。











