近日,人工智能领域传来新动向,深度求索公司即将推出一款备受瞩目的全新大模型——DeepSeek V3.2。这款模型计划在国庆假期前完成正式发布,其基础版本(V3.2-Base)已悄然上传至Hugging Face平台,但目前处于隐藏状态,普通用户暂时无法直接访问。
据技术文档披露,DeepSeek V3.2的参数规模高达6850亿,采用BF16-F8_E4M3-F32张量类型进行计算,并以Safetensors格式存储模型权重。这种配置在同类模型中属于较高水平,显示出开发团队在算力优化和存储效率上的技术追求。不过,截至目前,官方尚未发布完整的模型卡片,也未部署可供调用的推理服务,开发者社区暂时无法进行实际测试。
与该系列此前模型的发布策略不同,此次DeepSeek V3.2选择在技术文档准备尚未完全就绪时提前上传基础版本,这种“先存后释”的节奏引发了AI社区的广泛讨论。部分开发者认为这可能是为后续快速迭代预留空间,也有观点指出这或许与当前大模型领域的竞争态势有关。尽管具体发布细节仍待官方确认,但可以预见的是,这款参数规模庞大的新模型将为行业带来新的技术参考。