近日,Nous Research公司震撼发布了一个名为Psyche的全新项目,该项目是一个基于Solana区块链的去中心化人工智能训练网络。这一创新平台旨在动员全球用户利用闲置的计算资源,共同参与尖端AI模型的研发工作。通过采用DisTrO技术,Psyche成功大幅削减了带宽需求,并启动了一项前所未有的互联网分布式训练任务,目标是构建一个拥有40亿参数的AI模型,并将所有数据、检查点等完全对外开放。
Psyche网络的核心在于其去中心化的理念,彻底颠覆了传统AI训练对集中式数据中心的依赖。该平台通过Solana区块链来协调全球范围内的分布式GPU资源,使得任何人都能贡献出闲置的计算能力,参与到模型的训练中来。据悉,Psyche的首要任务是预训练一个名为Consilience的模型,该模型采用多头潜在注意力架构,并基于一个包含20万亿token的超大规模数据集进行训练,这一数据集由FineWeb14T、FineWeb-24T和The Stack v21T等部分组成。此次训练任务不仅是互联网上有史以来规模最大的分布式AI训练,同时也标志着去中心化AI开发领域的一个重要里程碑。
Nous Research强调,Consilience模型在设计时充分考虑了高效性和可访问性。其40亿参数的规模适中,既可以在高端的H/DGX服务器上完成训练,也能在消费级的RTX3090 GPU上运行推理任务。该模型还支持长上下文处理,为高级推理和创意应用提供了坚实的基础。这种规模的选择巧妙地平衡了性能与普及化的目标,为中小型团队和个人开发者提供了一个强大的工具。
Psyche网络的成功在很大程度上得益于Nous Research自主研发的DisTrO技术。这项技术通过优化器创新,将GPU间的通信数据量压缩了1000至10000倍,其原理类似于JPEG图像的频率域转换压缩。DisTrO允许每个节点独立进行训练,而无需在每一步都进行同步,从而显著降低了网络延迟和带宽需求,使得全球各地的异构硬件能够协同工作,共同参与到AI模型的训练中。
在Psyche网络中,Solana区块链扮演着至关重要的角色。智能合约负责存储训练元数据、参与者列表以及随机分配任务,确保了整个训练过程的透明性、防篡改性和抗审查性。Solana的高吞吐量和低交易成本使其成为处理分布式训练微交易的理想平台,进一步增强了Psyche的全球可扩展性。
Psyche项目致力于通过全面开源来推动AI的普及化。所有训练数据、检查点和结果都将被公开分享,并托管在Hugging Face和GitHub等平台上,供全球开发者免费访问和使用。目前,Psyche的代码已经开放,开发者可以通过Rust-based系统和P2P网络参与到优化工作中来,或者基于开放文档构建自定义的应用。
Nous Research还计划进一步扩展Psyche的功能,包括支持模型微调和社区数据输入等。这将使得小型团队甚至个人能够定制专属的AI模型。例如,社区成员可以上传领域特定的数据,训练适用于教育、医疗或创意等领域的模型。这种社区驱动的模式有望激发全球范围内的创新活力,并对OpenAI、DeepSeek等集中式AI巨头形成有力挑战。
Psyche的发布标志着去中心化AI进入了一个快速发展的新阶段。与传统的云端AI相比,Psyche的分布式架构不仅降低了训练成本,还通过区块链激励机制将算力贡献从“捐赠”转变为“交易”,从而吸引了更广泛的参与。此前,Psyche已经成功完成了一项150亿参数模型的测试训练,跨越了1.1万步,验证了其在全球网络中的稳定性和可靠性。
在测试网启动仅44分钟后,Psyche项目便通过捐款筹集了价值50万美元的GPU算力,这充分展示了社区对Psyche项目的高度热情和积极参与。这一成功不仅为Nous Research带来了极大的鼓舞,也为去中心化AI的发展注入了新的动力。
作为AI领域的权威观察者,有观点认为,Psyche的推出不仅是Nous Research的一个重要里程碑,同时也是去中心化AI发展的一个转折点。其创新的DisTrO技术和Solana区块链的结合,为全球开发者提供了一个前所未有的参与AI开发的机会,打破了技术和资源的壁垒。对于中国的AI社区而言,Psyche的开源框架有望为国产模型如Qwen3等提供更加高效的本地化微调方案。