ITBear旗下自媒体矩阵:

量化私募九坤投资发力AI!IQuest-Coder-V1代码大模型开源引关注

   时间:2026-01-02 14:49:26 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

中国量化私募领域再掀波澜,九坤投资旗下至知创新研究院推出的IQuest-Coder-V1代码生成模型系列引发全球开发者关注。这款覆盖7B、14B和40B参数规模的模型,在SWE-Bench Verified基准测试中取得81.4%的突破性成绩,超越外界推测参数达千亿级的Claude Opus-4.5和GPT-5.2,成为当前软件工程领域性能最强的开源模型。

模型架构创新成为核心竞争力。研究团队采用分组查询注意力机制降低显存占用,原生支持128K上下文长度使其可直接处理完整代码仓库。76800个token的超大词表设计,精准覆盖编程中常见的标识符和路径组合。特别值得关注的是40B参数的Loop版本,通过共享参数的循环Transformer架构,在仅增加5%训练成本的情况下,实现与数百亿参数MoE模型相当的性能表现,HBM和KV Cache开销显著降低的同时,吞吐量提升达300%。

训练策略颠覆传统范式。区别于静态代码片段学习,研究团队构建基于项目生命周期的(R_old, Patch, R_new)三元组数据集,专门截取项目40%-80%成熟期的变更记录。这种动态演化训练方式使模型能捕捉代码修改前后的逻辑差异,理解真实工程中的试错过程。官方演示案例显示,该模型不仅能生成具备交互物理效果的粒子动画,还能构建支持实时元素更新的像素沙盒游戏,其生成的太空射击游戏更包含完整的战斗反馈系统和多模式控制机制。

技术突破背后是顶尖人才储备。九坤投资联合创始人王琛作为图灵奖得主姚期智院士的博士弟子,与北大数学系毕业的联合创始人姚齐聪共同搭建起超过百人的投研团队,其中博士占比超60%,成员多来自清华、北大、斯坦福等名校。此次模型研发的核心团队与《Scaling Laws for Code》等顶会论文作者高度重合,谷歌学术被引量超1.6万次的Jian Yang等资深研究员的加入,为模型训练提供坚实理论支撑。

开源策略加速技术普惠。当前GitHub平台已开放全系列模型下载,Int4量化版本可在单张消费级3090显卡部署,基础版本支持单卡H20推理。这种低门槛部署方案引发开发者社区热烈讨论,在Hugging Face平台累计获得超5万次下载。研究团队特别强调,所有代码生成均在沙盒环境验证,确保应用安全性。

量化巨头的技术转型路径渐明。作为管理规模数百亿的头部私募,九坤投资近年持续加大AI领域投入,其IT算力建设已跻身国内量化机构前三,并设立数据实验室和人工智能实验室等前沿部门。此次代码模型突破并非孤立事件,2025年12月该公司推出的通用推理模型URM已在ARC-AGI测试中取得53.8%准确率,显示其在基础模型研发领域的持续积累。

行业观察人士指出,量化私募凭借高频交易场景积累的算力优势和工程化能力,正在AI基础模型领域形成独特竞争力。九坤模型采用的动态演化训练策略,为解决代码生成领域的长上下文依赖问题提供新思路,其开源生态建设或将重塑开发者工具链格局。随着3090等消费级显卡即可部署大模型的实现,AI辅助编程可能迎来新一轮普及浪潮。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version