旧金山的人工智能新兴企业Prime Intellect近日震撼发布了一项名为“环境中心”的创新平台,该平台致力于开放强化学习(RL)环境的构建与共享,意图打破大型AI实验室所构建的封闭生态系统。
Prime Intellect强调,交互式训练环境已成为制约AI进一步发展的关键瓶颈。在强化学习中,AI代理通过与预设规则的环境互动进行学习,只有在面对不断变化的环境时,才能展现出真正的智能。“强化学习若无环境交互,便如同无根之木。”公司如此表述。
近年来,众多大型实验室斥巨资打造专属RL环境,并逐步将训练数据私有化。这一趋势正导致开源社区在训练具备竞争力的AI模型方面面临严峻挑战。Prime Intellect希望通过“环境中心”提供一个开放的替代方案,避免AI发展陷入“围墙花园”的困境。
作为下一代开源代理模型INTELLECT-3的数据引擎,环境中心将扮演核心角色。该模型将基于社区贡献的RL环境数据进行训练,旨在成为“全面开放且技术领先的代理模型”。
为了推动环境建设,Prime Intellect推出了一系列现金奖励任务,旨在寻找能够评估代码质量、支持长时间运行任务以及激发创意写作的强化学习环境。此举意在降低开发门槛,吸引更多开发者参与到先进AI模型的构建中来。
Prime Intellect由Vincent Weisser(去中心化科学领域DeSci的活跃人物)和Johannes Hagemann(曾在Aleph Alpha负责大模型训练)共同创立。公司专注于去中心化AI、共享算力资源以及在分布式系统中训练模型。