ITBear旗下自媒体矩阵:

小米发布MiMo-V2-Flash开源模型,在线AI聊天服务同步上线,代码能力比肩标杆

   时间:2025-12-18 05:42:34 来源:ITBEAR编辑:快讯 IP:北京 发表评论无障碍通道
 

小米公司近日正式推出开源MoE大模型Xiaomi MiMo-V2-Flash,该模型总参数量达3090亿,激活参数量150亿,凭借卓越的推理效率在智能体AI领域引发关注。据官方披露,模型通过Hybrid注意力架构创新与三层MTP推理加速技术,在多个Agent测评基准中跻身全球开源模型前二,代码能力比肩闭源标杆模型Claude 4.5 Sonnet,同时将推理成本压缩至其2.5%,生成速度提升两倍。

技术架构方面,Xiaomi MiMo-V2-Flash采用1:5配比的Global Attention与Sliding Window Attention混合结构,窗口大小设定为128,原生支持32K上下文长度并可扩展至256K训练。模型负责人罗福莉在2025小米人车家全生态合作伙伴大会上透露,团队通过三层MTP推理加速实现并行Token验证,使推理速度提升2至2.6倍,这种设计使其在代码生成、复杂任务拆解等场景中表现突出。

实际应用层面,该模型已初步展现模拟物理世界的能力。测试案例显示,其可通过HTML代码编写简易操作系统,模拟太阳系运行轨迹,甚至生成具有交互功能的圣诞树动画。这些能力得益于模型对多模态数据的深度理解,使其在智能体任务中能更精准地模拟人类操作逻辑。

为降低使用门槛,小米同步推出在线AI聊天服务Xiaomi MiMO Studio,用户可在平台体验模型深度思考与联网搜索功能。该服务支持多轮对话中的上下文理解,能根据用户需求自动调用工具链完成复杂任务,例如同时处理文档分析、数据可视化与报告生成等跨领域需求。

团队背景方面,模型负责人罗福莉拥有北京师范大学计算机本科与北京大学计算语言学硕士学位,曾主导阿里巴巴多语言预训练模型VECO开发,并推动AliceMind开源项目。2022年加入DeepSeek期间,她参与研发的MoE大模型DeepSeek-V2引发行业关注。去年底,这位技术专家以千万年薪加盟小米的消息曾登上热搜,其朋友圈官宣文案"智能终将从语言迈向物理世界"引发技术圈热议。

在合作伙伴大会上,罗福莉进一步阐释技术愿景:"下一代智能体不应局限于语言模拟,而需构建真正理解物理世界规则、能与环境动态交互的系统。"这一理念与小米"人车家全生态"战略形成呼应,暗示模型未来可能深度融入智能家居、自动驾驶等场景,推动AI从辅助工具向主动参与者转型。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version