DeepSeek 公司在 Hugging Face 开发者平台上发布了其 R1 推理 AI 模型的最新版本,这一消息周三早晨首先通过其官方微信公众号揭晓。据 DeepSeek 透露,此次更新的 R1 版本采用了宽松的 MIT 许可证,允许商业应用,但更新内容被描述为“小幅改进”。在 Hugging Face 的模型库中,新版本并未附带详细介绍,仅提供了必要的配置文件和模型权重。
这款更新后的 R1 模型拥有惊人的 6850 亿参数,规模之大使得普通消费者级硬件难以直接运行。如此庞大的模型体量,无疑为 AI 技术的应用设立了新的门槛。
早前,DeepSeek 因推出 R1 模型而迅速走红,该模型在性能上表现出色,一度能与 OpenAI 的产品相媲美。此次更新,尽管幅度不大,但依旧引起了业界的广泛关注。