在2026年北京智源大会上,理想汽车首席技术官谢炎向外界揭晓了其自研车端AI推理芯片马赫M100的详细技术方案。这款采用5nm车规级工艺的芯片单芯片算力突破1280TOPS,算力利用率达到82%,在性能验证环节展现出显著优势。针对当前AI推理领域面临的三大核心挑战——计算范式适配性、资源利用效率及并行协调效率,理想汽车通过架构创新提出了系统性解决方案。

传统指令驱动架构在AI推理场景中暴露出明显短板,GPU保留的动态调度模块占据大量晶圆面积却未能带来性能提升,中心式调度架构的层级开销更成为并行扩展的瓶颈。马赫M100通过四项关键架构创新破解难题:采用分布式数据触发执行替代中央调度,以大容量分布式SRAM取代多级Cache,构建Mesh与DRB双互联架构,并由编译器与运行时系统协同管理数据流动。其核心空时调度器可同时处理空间与时间维度的数据调度,生产者-消费者同步模型则有效解决了大规模并行系统的协同问题。
在性能测试中,马赫M100在CNN骨干网络、UniAD及理想自研MindVLA三类基准测试中均实现数倍性能提升,帧率达到行业对标方案的两倍,系统端到端延迟降低40%。该芯片在300M参数规模下可稳定输出2K分辨率画面,谢炎现场演示了将Qwen-3 4B模型部署于马赫M100运行Agent任务的实测效果,验证了其在实际应用场景中的可行性。
系统工程层面,马赫M100的CCU控制器搭载先进散热体系确保性能稳定输出,PCB采用高密度集成设计缩小体积,双SoC、双MCU、双供电的冗余架构满足ASIL-D最高安全等级要求。这款芯片将与理想自研的马赫VLA大模型、星环OS操作系统及配套编译器形成技术闭环,未来可拓展至LLM推理、智能体交互、具身智能等多元应用场景。











