ITBear旗下自媒体矩阵:

国产大模型新动态:OpenRuter现双雄,DeepSeek V4发布在即引期待

   时间:2026-03-12 16:16:19 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

近期,国产大模型领域动态不断,此前备受瞩目的DeepSeek V4虽多次传出发布消息却均未成真,而如今又有两款新大模型在OpenRuter平台引发广泛关注与热议。

此次出现在OpenRuter平台的是两个不同型号的大模型。其中一个代号为Hunter Alpha,拥有高达1万亿的参数量,支持1M上下文,并且具备多模态输出能力;另一个代号Healer Alpha,其上下文为262k,同样支持多模态,不过参数量未对外公布,但输出速度相对更快。

对于Hunter Alpha,不少人猜测它就是即将发布的DeepSeek V4。然而,AI大模型评测领域的知名人士@karminski - 牙医却表示,Hunter Alpha并非DeepSeek V4,而是智谱的新模型,极有可能是智谱新一代的旗舰大模型。从DeepSeek过往发布新品的风格来看,这种猜测似乎也有一定道理。DeepSeek在发布新品前,通常不会在Openruter这样的平台进行测试,而是习惯低调上线,之后仅在群里发布一条简短消息来确认新品发布。

尽管DeepSeek V4尚未正式发布,但网络上关于它的各种传闻却层出不穷。有传闻称,DeepSeek V4拥有1万亿参数量,MOE激活320亿参数,支持1M上下文,具备原生多模态能力,并且针对昇腾910C平台进行了优化,并非仅局限于为NVIDIA或者AMD等国外芯片优化。不过,这些爆料的可信度有待考量。

相比之下,有一条爆料显得更具可信度。知名量化专家@bdsqlsz被发现在HuggingFace上传了DeepSeek - V4 - INT8权重,这一举动暗示了DeepSeek V4支持INT8算法,更重要的是,这似乎意味着DeepSeek V4的发布已经进入倒计时。

还有消息透露,DeepSeek要求供应商在6 - 20号期间保持稳定,并且最近两天还在进行最后的压力测试。种种迹象表明,DeepSeek V4或许很快就会与大家见面,大家不妨耐心等待。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version