我看 MiniMax 闫俊杰：「心舟」已过万重山-业界动态-ITBear科技资讯

大模型带来的一个变化，就是新时代的中国技术创业者，即便依旧需要商业世界的支持，也终于可以放下技术理想带来的「羞耻感」了。

最近，《罗永浩的十字路口》访谈 Minimax 创始人闫俊杰的视频在我的朋友圈刷屏了。

这是一场我看着挺惊喜的对话。两个看似处于平行世界的人——一个是互联网初代网红、公认东半球语言大师+自信东半球最好产品人罗永浩；一个是过去极度低调、表达天赋算不上有优势，但是绝对堪称 AI 技术极客的闫俊杰。

这两位硬生生聊了四个小时的「马拉松式」的访谈，其实源于我个把月之前的拉群介绍。客观地说，拉群的时候，我当时是有点担心罗老师能不能说服颜闫俊杰出来和他进行这种马拉松对话。

闫俊杰毕竟一个典型的理工男，业界也都知道他平时鲜有接受采访或者公开做访谈。面对老罗这样洞察力和表达力都十分犀利的提问者，会不会因为彼此担心变成一场「尬聊」而搁浅？

结果证明，罗老师绝对可以的，他的访谈频谱极其宽广，在视频播客领域一骑绝尘是理所应当的。不过，更重要的是，闫俊杰在这次访谈里让我看到了有意思的变化。甚至可以说是个阶段性的蜕变。

今天我就说说我看到的闫俊杰和他最近这些变化到底是什么？

一定要搞一次「纯粹」的技术创业

过去 20 多年，我深度交流、了解、持续观察过大几百个创业者。如果我非要给闫俊杰贴一个标签，那在我眼里，「渴望纯粹」的技术创业者可能是最贴切的。

这要从他「小时候」说起。其实闫俊杰认识我，比我认识他早。因为我们俩第一次见面时候他和我说，早在他大学时期，他就是我当年做科技杂志主编时候的读者，甚至现在竟然还着记得一些当时我每期《编者的话》里关于科技趋势的一些「暴论」观点。

我这辈子做内容一直围着技术趋势和产品创新在转，可能从来没有赢得过「大众」读者群。所以得知一个当时的大学生就对这些「小众科技内容」如数家珍，看得出来他首先是个「真极客」。

「真极客」对技术的趋势都是敏感的。外界往往觉得中国这一波大模型创业浪潮是被 2022 年底的 ChatGPT 引爆的，但在闫俊杰的时间表里，他早在 2021 年底就已经出发了。

在创建自己的公司之前，他是商汤最年轻的 CTO。他在商汤科技 7 年，经历了 AI 1.0 时代的整个周期。我记得 2023 年极客公园前沿社冬季会晤的一场闭门交流中，闫俊杰曾经分享过那个技术时代的无奈：那是一个模型不通用，只能靠工具补齐的时代。A 有需求就为 A 定制一个模型，B 有需求就为 B 定制一个模型。业内唯一能做的通用化努力，只是把生产工具做通用了，用来更批量地生产那些注定无法通用的模型。

这种范式看起来热闹，但本质上没有跳出做项目的桎梏，边际成本极高，社会价值却很薄。这个技术底座上，根本不可能做一个「纯粹」的技术创业。这一度让他很沮丧和迷茫。

说白了：如果继续沿着旧路走，为了定制模型而把工具做通用，是死路一条。真正的出路必须反过来——把模型本身变成通用的。只有模型足够通用，定制成本才会归零，技术才能真正普惠。

这个认知的转折点发生在 2020 年的一个深夜。当他第一次读到 CLIP 的论文时，那种冲击感让他激动的两三天没睡着觉。他在那篇论文里看到了一个惊人的未来：文本和图像之间的柏林墙倒塌了，它们在深度学习的底层本质上是统一的。这意味着 AI 1.0 的死结解开了：只要预训练模型做得足够好，AI 就通用地处理世间万物。

在这次老罗的采访中，他又一次提到：「当这件事发生时，如果你真的相信人工智能，你就应该去做点什么。」于是，他几乎立即决定 All in 开始自己的 AI 创业。

当 2022 年末 ChatGPT 横空出世的时候，刚开始创业的 MiniMax，其旗下的 Glow 每天处理着数以亿计的 Token，体量一度超过早期的 ChatGPT。这看起来似乎还不错，但实际上是令人担忧的。

我曾经问过闫俊杰他有没有遗憾当时 Glow 这个产品形态的选择问题？闫俊杰的思考有点不一样，他觉得 Glow 停留在娱乐层面，并非产品定位的主动选择，而是被当时的技术水位锁死了边界——是一个模型的技术能力，决定了一个产品的最终形态。

这一认知，被随后的一次事故残酷的印证了：仅仅因为一次参数调整导致对话智能度轻微下降，三天内活跃用户就跌去了 30%。

这让他进一步确信，依托技术创新的商业回报不是靠运营、技巧和工程复杂度堆砌的，而是底层技术能力的直接映射。在这个逻辑里，追求 AGI 与追求商业回报不再是两条平行线，而是完全重合的同一条曲线——智能每提升一分，用户的留存时长就增加一分。漂亮的商业数据不再是技术的对立面，而是检验模型是否逼近 AGI 真相的唯一试卷。而这，就是所谓「更纯粹的技术创业」。

自此之后，MiniMax 所有不太容易被人理解的决策，都基于这套逻辑。比如 2023 年，当大多数人还在研究如何复现 LLaMA 时，MiniMax 决定要做 MoE（混合专家模型）。在当时，除了不开源的 OpenAI，外界几乎没有成熟参考，这是一片无人区。选择这条路，意味着没有开源社区的作业可抄，一切都要摸黑探索。代价是惨重的——MiniMax 经历了 3 到 4 次严重的预训练失败，每一次模型崩了，就意味着两个月的研发周期白费，以及单次高达 1500 万美金的算力成本打了水漂。

时代给了搞技术的新环境，这时候最关键的就是不能有「烧钱的羞耻感」，这背后核心是要有信仰和够坚定。如果相信MoE 架构的上限更高。为了那个能支撑起大几千亿参数的上限，他需要更纯粹，必须忽略「算小账」。

在这次罗永浩的对谈里，他讲到的敢于在全模态上做研发，也是同样的逻辑。

在创业第一天，他的动力和决心都是来自于一个论断：真正的 AGI 一定是多模态的。但是对于一个早期资源有限的创业公司，真要要坚持文本、语音、视觉三线并行确实很少见，因为在旁人眼中这是「兵力分散」。

最终让闫俊杰坚持践行这个论断的，本质上还是基于第一性原理的「纯粹」。他发自内心的相信 Scaling Law，相信不同模态在深度学习层面是等价的，那么即便早期众所周知的算力限制，不能上来就搞「原生多模态」，但是 MiniMax 还是坚持把它们作为三个独立模型训练。看得出来，他始终在为最终的融合做准备。

选择单独的模态聚焦「放卫星」维持「技术形象」，是资源有限条件下的「精神胜利法」。但如果更纯粹一些去看技术竞争的底层，还是需要直面有限资源，但不能放弃解决根本问题。

哪怕要走之字形路线，要有点悲壮的长期「追赶」，也没关系。因为这才是那个「更纯粹的选择」。

在「冲击」里才能锻造「道路自信」

我相信对闫俊杰和国内其它很多大模型创业者，2025 年都是天崩开局。

2025 年春节，DeepSeek R1 的突然爆发，给整个国内大模型行业带来了巨大的冲击。那种震撼感，不亚于当年的 ChatGPT，几乎在一段时间内把所有国内大模型创业者都「干自闭了」，所有人都沉默了相当长时间。

我看到在和老罗的采访中，闫俊杰也很坦诚地回溯了那个时刻，他也陷入了长久的自我反思。别人的成果突破带来的冲击，直接让他开始自省：是技术路线有问题吗？是我们的团队降低了要求？还是我们搞了其他的杂念，在追求 AGI 的路上不够坚定了？

我相信对于国内所有的大模型公司，「自省」之后，都面临着选择。一方面是国内同级生里出现了得高分的同学，这已经动摇了大家反正都相对落后硅谷的「模糊状态」，这时候必须对于是否要继续海量投入，继续在模型本身较劲追赶甚至寻求超越做选择。

面对国内本身就看重尽早产生商业收入的「资本审美」，如果你不能破釜沉舟在技术上紧紧咬住，甚至能保持领先的极少数，那就真不如尽早思考「开源节流」的事情了。

据我了解，闫俊杰的选择是把自己更彻底地扔进模型技术这个更纯粹的维度去死磕。曾经被外界还有猜测所谓依托模型可用能力「沿途下蛋」做产品工厂，去抓用户提收入，进而支撑估值逻辑的另一种路线，反而明确不存在了。闫俊杰的选择是「华山只有一条路」和「狭路相逢不能躲」。

有意思的是，他还做了一个极其实用、也极其简单有效的决定——在战略上坚决聚焦技术，同时组织上，发更多的钱！用这种最直接实在的方式，让大家把丢掉的信心捡回来，把分散的注意力聚回来。还是那个逻辑，忠于目标，做该做的有效动作，不要有「羞耻感」。

在我看来 2025 年这一年，MiniMax 的聚焦和坚定之后，确实连续打赢了三场坚定信心的硬仗：

（1）架构创新的抢跑：2025 年 1 月，当行业还在 Transformer 的舒适区里内卷时，MiniMax 率先发布了国内首个线性注意力架构（Linear Attention）模型 MiniMax-Text 01；6 月，更是开源了全球首个大规模混合架构推理模型 MiniMax-M1。

虽然后来的 M2 模型并未完全沿用这一特定架构，但这种敢于偏离主流的探索本身，在我看来是有含金量的。它证明了 MiniMax 绝不是只会等着硅谷发论文再跟进的好学生，而是真正严肃的 AGI 挑战者——敢于为了更高的上限，去试错别人没走过的路，去无人区寻找更优解。

（2）底层算法的反向输出：在 M1 模型中，MiniMax 还提出了一种全新的强化学习算法CISPO。这不仅仅是一个技术名词，因为随后硅谷巨头 meta 发布的 ScaleRL 训练框架也采用了这一算法。这是中国创业公司在底层算法逻辑上，对国际巨头的一次罕见且硬核的技术输出。

（3）定义交互的新标准：到了 10 月，随着 M2 模型的发布，MiniMax 首次将 Interleaved Thinking（交错思维链）推向了行业标准。这种让模型「像人一样边想边做」的能力，迅速获得了 OpenRouter 等国外知名开发者平台的支持。随后，不少大模型公司才纷纷跟进。这一次，不再是硅谷定义规则，而是 MiniMax 在定义什么是「更好的交互」。

这三场战役之后，在和老罗的对谈中，我其实反而看到了和年初时候相比，一种不一样状态的闫俊杰：似乎一种松弛感出现了。这种松弛感，可能也是因为他手里拼图的最后一块——文本模型，终于拼上了。

他和老罗的交流里，其实有一段很重要的信息。当时非常坦诚地盘点了一下 MiniMax 的家底：两年前，他们的语音模型做到了国际领先；一年前，视频生成模型也冲到了国际前列；连音乐模型现在也是全球三强。唯独语言模型，之前一直还要差点火候。但随着这次新模型 M2 的发布，MiniMax 的语言模型得到了国际开发者的认可，开始被用来做 Agent 和写代码——这意味着 MiniMax 补齐了最后一块短板。

他向老罗描绘了一个比外界认知更加残酷的 AI 技术竞争格局。他认为在美国，真正能坐在大模型牌桌上的其实只有四家公司：OpenAI、Google、Anthropic，以及 X.AI。那么他心中 MiniMax 的位置，则是成为全球极少数具备全模态整合能力的公司。「客观来看，我们可能是中国唯一一家，在文本、视频、语音、音乐全模态上都做到国际领先的公司。」

而让他在这个全球技术格局中保持自信的，是中国公司独特的「效率优势」。比如他跟老罗算了一笔账：美国的这四家核心公司，估值和收入可能是中国公司的 100 倍，但技术领先幅度可能只剩下 5%。「中国公司花美国同行 1/50 的钱，做出来的效果只差 5%，而且这个差距还在缩小。」

闫俊杰相信当全模态的数据和模型完成最终整合时，将通向一个从量变到质变的时刻。「我们现在还没有合在一起。我觉得实际上现在是我们最虚弱的时候。」

这句话的坦诚是符合闫俊杰的性格的，但这句「现在是我们最脆弱的时候」在公开访谈里说出来，是不符合他这些年来对外沟通的谨慎风格的。这种变化，只能说明他内心应该已经完成某种印证「道路自信」的构建。

能说自己现在很脆弱的人，大多不那么脆弱。他已经看到了某种明确技术能力上的自信。其实闫俊杰是一位非常关注底层逻辑的人，但如果有自信，一定是因为一些底层逻辑得到了验证。比如过去两年外界对谷歌一度非常看衰，觉得巨头掉队了。但闫俊杰却一直非常笃定地跟我说：「谷歌一定会追上来」，「他们的 TPU，非常值得关注进展」。

现在看来他说的是对的，他看透了算力基建对模型迭代的决定性支撑，以及 TPU 和模型深度共振的意义。今年 Google 的帝国反击战，确实也和其充分利用了 TPU 这个阵地，进行了充分发挥优势的技术突破紧密相关。

那么从这个访谈里看到的 Minimax 多模态模型能力「分头并进，最终融合」的路径，可能就是闫俊杰道路自信里重要的底层逻辑。

从他这次和老罗的交流细节来看，有理由相信，「天崩开局」的 2025，可能也恰恰是闫俊杰自身「道路自信」最终建立的 2025。

商业世界里谈理想和追求，

不应该再有「羞耻感」

曾几何时，在中国做一家真正的技术公司，想很纯粹的依托技术本身形成大的商业价值闭环，是无比艰难的。过去很多年，所谓技术公司跑到最后，技术本身都往往只是个在最终价值创造中看似不可或缺，但其实也占比很少的东西。

这可能来自于技术本身在特定时期的局限，也一定和我们的特定时期的商业环境有关。但不管怎样，那些出发时候带着技术信仰和热情的创业者们，很多人也被商业世界的调教到要不就是放弃最初的目标，要不就是不得不接受现实，去适配环境，甚至被环境所改造。

由于几乎没有新兴技术创业公司的成功案例，以至于一段时间以来，技术理想这个真正的「核动力」，在一个人或者公司没做出伟大成果之前，都是「不足为外人道也」。甚至是在商业世界你公开说「理想和追求」，都成了有点「羞耻感」的东西，因为很少有人理解和相信，还会觉得你装 X。

但到了今天这个新的技术时代和新的社会环境，情况也应该开始改变了。很多人觉得只有硅谷可以支持「技术理想」，但我觉得不要简单接受结论，而是要拆解为什么是这样，以及改变怎样才能发生。

历史可以告诉未来，但历史不会就是未来。这种改变需要的可能就是一个合适的技术时代和一个足够成功的案例，之后星星之火未必不能燎原。

就像很多人都没意识到，DJI 这样的一家公司，在深圳就激励了多少新的硬件创业者敢于鄙视「性价比」，进而敢于要做全球最好的产品，拿到最高的毛利，然后做更伟大的公司。今天这不就是新的常态吗？

「纯粹」是有意义的，把更高的技术追求和更大的商业价值结果变成一个统一逻辑，开始成为越来越符合时代和环境的技术创业路径。

看了闫俊杰和罗永浩这这四个小时的交流，能感受到闫俊杰这几年的从思考到实践的闭环，正在打破了一种隐形的「理想主义羞耻感」，不再把技术追求包裹到某个流行的，为了取悦投资人的商业故事里，而是写下一个自带生命力的、统一的新故事。

它的好处是，你不再对世界有局促和含蓄，而变成了坦荡——只要你自己足够相信这个「大一统」故事，就可以说出来和值得做下去。该羞耻的是那些只看见历史，而不敢下注未来的人，不是这些技术创业者们。

在和老罗的采访中，闫俊杰有一段说的挺好的：如果要反思技术做得好，到底需要什么。他把它总结为两个词，一个是想象力，一个是自信。美国企业在自信方面做得很好，他们敢于讲我要引领这个行业。中国科技企业要更上一个层面，要引领世界，归根到底也需要坦荡的自信。

世界总有人会相信和支持你，管他是因为发自内心的认同，还是不明就里的 FOMO。时代给了技术创业者伟大的机遇，如果本身所有投资人最终都要浪费 95% 的钱（这就是风险投资投资的本质），就让他们都浪费在「哥伦布」身上，这才更有意义。