智谱GLM-5.2发布后不久,关于中国模型何时能对标Anthropic最新Fable级别的问题,引发了特斯拉CEO马斯克与智谱创始人唐杰的公开讨论。
这场讨论的直接背景,是智谱AI于近日上线并开源的新一代旗舰大模型GLM-5.2。该模型在FrontierSWE编程基准测试中得分74.4,接近Anthropic顶级模型Claude Opus 4.8的水平。甚至在全球百万用户参与盲测的前端开发评估系统Code Arena上,该模型位列全球可用模型第一位。
一名用户在社交媒体X上向独立研究员、AI 开发博主Teortaxes提问"中国大模型何时达到Fable级别?"。
这里的“Fable”指的是Anthropic于6月9日向公众开放的“Mythos级别”系列模型Claude Fable 5。据Anthropic称,Fable 5的性能超越了公司以往发布的所有模型,在几乎所有AI性能基准测试中均处于领先水平。
Teortaxes的推算:7个月差距
Teortaxes的推算分两步走:
第一步,先定位GLM-5.2的水平。 他认为GLM-5.2的整体能力大致相当于Claude Opus 4.7到4.8之间。
第二步,再看目标位置。 Mythos级别(Fable所在的梯队)在2026年2月就已经进入了预览状态,完整版于6月正式开放。
基于这两个参照点,Teortaxes推算出中美模型之间大约存在7个月的时间差,时间窗口大约在2026年11月到12月。
马斯克的判断:可能2027年Q1
马斯克随即在帖子下回复:“可能(2027年)第一季度。 ”
不过,马斯克随后补充了一个重要分层:在基准测试层面,追赶的进展或许确实令人印象深刻;但如果以“真实实用性”来衡量,即便到2027年Q1能达到也已经相当出色。
他特别指出,Anthropic的优势在于专注于提升“有用的智能”,这种能力不一定体现在基准测试的分数里,但会直接反映在营收上。
唐杰的回应:“不需要那么久”
被点名的GLM-5.2缔造者——唐杰随即在X平台上回应,他仅用一句简短的表态:“won't take that long”(不需要那么久)。
唐杰并未给出具体的时间节点,但这一表态隐含了智谱对自身迭代速度的信心。
从Teortaxes的“7个月”,到马斯克的“2027年Q1”,再到唐杰的“不需要那么久”——三个时间预期之间横亘的,不只是技术判断的差异,更是对“追赶”这件事理解方式的不同。
关于“中国大模型何时追上Fable”这个问题?你是怎么认为的?









