ITBear旗下自媒体矩阵:

AI模型训练如“炼金”?Silico工具让开发者精准掌控模型构建过程

   时间:2026-05-07 14:19:03 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

旧金山科技初创公司Goodfire近日推出一款名为Silico的创新工具,旨在为人工智能模型开发提供前所未有的透明度与控制力。该工具允许研究人员和工程师在训练过程中直接观察模型内部结构,并实时调整影响模型行为的参数设置,使AI开发从经验驱动转向系统化工程。

传统大语言模型如ChatGPT虽具备强大能力,但其决策机制如同"黑箱",导致缺陷修复和伦理控制面临挑战。Goodfire首席执行官埃里克·何指出:"当前主流思路是依赖规模扩张,但我们主张通过机制可解释性技术开辟新路径。"该公司将这种技术比作对AI进行"脑部扫描",通过绘制神经元连接图谱来解析决策过程。

Silico的核心突破在于将可解释性技术贯穿模型开发全周期。不同于仅对训练完成模型进行事后审计,该工具在训练阶段即介入参数调整,内置的智能体可自动化完成复杂分析任务。埃里克·何强调:"我们暴露了所有控制旋钮,让开发者能像调试精密仪器般训练模型。"

在开源模型Qwen 3的测试中,研究团队发现特定神经元激活后会导致模型将所有回答转化为道德困境表述。通过Silico定位该神经元后,开发者成功抑制了这种异常行为。更引人注目的是伦理价值微调实验:当调整与"透明度"相关神经元权重后,模型对产品缺陷披露问题的回答从"拒绝公开"转变为"应当披露"。

该工具还能从数据源头预防错误参数形成。针对模型常出现的"9.11<9.9"计算错误,Silico分析显示,这是由于训练数据中《圣经》章节编号和软件版本号排序规则导致的神经元误激活。开发者据此重新设计训练路径,使模型在数学计算时自动绕过相关神经元。

阿姆斯特丹大学学者莱昂纳德·贝雷斯卡评价称,Silico为中小企业提供了与顶尖实验室比肩的可解释性能力。医疗和金融领域企业将率先受益,这些行业对模型可审计性有着严苛要求。虽然他质疑将AI开发完全"工程化"的提法,但承认该工具能显著降低可解释性研究门槛。

Goodfire采用差异化定价策略,目标客户包括自建模型企业和开源模型改造团队。埃里克·何表示:"当训练模型变得像软件开发,更多企业就能定制符合自身需求的专用模型。"目前已有多个行业团队参与封闭测试,具体定价方案将根据客户需求定制。

这项技术正在改变AI开发范式。传统依赖海量数据和算力的"暴力美学"遭遇挑战,机制可解释性派主张通过理解模型内在逻辑实现精准控制。随着Silico等工具的普及,AI系统或将逐步摆脱"黑箱"属性,向可解释、可干预的透明化方向发展。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version