在人工智能产品领域,Codex正以惊人的速度崛起,成为备受瞩目的存在。自今年年初起,其周活跃用户数量增长超五倍,增长态势极为迅猛,如今周活跃用户规模已达500万。尤为引人注目的是,知识工作者采用Codex的速度是开发者群体的三倍以上。
Codex用户数量的爆发式增长,与2月份桌面App的发布密切相关。该桌面版提供了专属且优化的使用界面,大幅降低了使用门槛,从而吸引了大量用户下载和使用。在Codex产品形态变化的背后,桌面应用团队负责人Andrew Ambrosino发挥了关键作用。他站在以“写代码”为核心的开发者工具链与迅速扩张至知识工作场景的通用AI工作入口这两个快速重叠的世界之间,对产品变化有着深刻洞察。
Andrew指出,产品开发逻辑已发生巨大转变。过去,实现功能成本高昂,开发前需进行大量事前去风险工作,如写文档、做研究和原型等。如今在OpenAI,情况截然不同,大量token的提供激发了人们的创意,多个团队可能同时探索一个功能的多种实现方式。这意味着实现功能不再是昂贵环节,而“品味”变得至关重要,具体表现为策展过程,包括判断尝试成果、框架化设计、确定切换按钮段位等决策。
对于“品味”,Andrew有着具体理解。它不仅包含美学层面,还涉及系统思维,即如何融入整个系统;有方向感,明确所属主题;有呈现方式,以及交互动画与语义是否相符等细节。真正的核心品味问题在于,在能建造任何东西的情况下,明确想要什么、是什么以及如何到达那里,这体现了人类大脑在新时代的价值。
Codex在写代码方面表现出色,但在设计生成上却不尽如人意。Andrew认为,这有多方面原因。设计比软件更难评分,人类品味作为反馈机制的一部分,使训练模型变得困难,难以用客观标准衡量。从研究投入看,实验室更注重提升加速AI研究本身的能力,设计能力对研究加速作用不直接。设计工作具有复杂性,包含文化层面,且需要新颖性,与软件工程希望代码遵循已知模式相反。最难的是抽象层理解,目前AI在这方面仍难以企及。
产品的成功不仅取决于设计,还与模型能力时机紧密相关。Andrew确信,若Codex应用在去年11月推出,会在市场上失败,而2月推出却大获成功,唯一变量是中间几个月模型能力的进步。这表明在AI时代,产品是否好用有价值,由“模型在这个时刻能做什么”决定,而非仅由UI或交互设计决定。这也改变了产品规划方式,不再是全年计划,而是根据模型能力时间点列出感兴趣内容,做原型并决定何时实现。
在Codex团队中,工程师、设计师、产品经理的边界变得模糊。Andrew的履历丰富,团队汇报关系不断变化,但成员紧密合作。团队里设计师能讲工程师语言,产品经理能写代码。Andrew认为,目前角色重叠明显,但并非彻底取消角色划分。每个专业仍有技能门槛,不能因“我也能写代码”就丢掉产品专业积累的最佳实践和试错经验。不过,能力不再与精通具体工具死死绑定,换角色比以前容易,但这一趋势被外界过度夸大。
关于当下最前沿的AI辅助开发方式,Andrew提到,如今“多少代码是AI写的”已不重要,重要的是代码是“有监督”还是“无监督”写出。团队在“自主开发软件”和“harness engineering”方向进行了探索,如让模型在夜里清理代码库。但目前模型倾向于让代码变复杂,团队希望模型能提升“删代码”能力,解决开发完全交给自动驾驶时遇到的问题,如判断功能取舍、搭建抽象结构等,目前团队正朝此方向努力。
Codex最初是命令行工具,后做成独立App,定位为“开发者工具”。内部试用时,除工程和研究场景反馈积极外,市场、公关等部门也在使用,尽管界面不友好。团队曾尝试将Codex能力搬到其他产品界面,但用户仍偏好Codex App。这使团队意识到开发者工具和通用知识工具边界正在坍塌,Codex和ChatGPT更像是同一能力的不同入口,应做成通用、可扩展的底层,承接各种深度场景。
Andrew提出“home base”概念,Codex应成为用户的“大本营”,用户可在此追踪待办事项,部分事情在App内完成,部分则调用其他应用。例如,Codex内置电子表格编辑器,但对于复杂财务建模,会直接与电脑桌面上的Microsoft Excel插件对话。Codex团队摄影师用Codex剪辑视频的故事,体现了Codex与专业工具协作的能力。Codex通过编辑Premiere Pro工程文件完成部分剪辑操作,还为自己写了扩展插件与Premiere Pro“对话”。
Codex(未来将与ChatGPT结合)致力于两件事。一是与用户已有的专业工具无缝协作,通过连接器、电脑操作能力或扩展插件实现交互和任务交接,无需重新制造工具。二是满足用户希望在Codex里直接打开网页应用并让其多做事的需求,团队目前正同时推进这两条路线。











