在人工智能领域,探索高效且环保的推理方法一直是科研人员关注的焦点。近日,加州大学洛杉矶分校的一支研究团队取得了一项突破性进展,他们成功地将光学原理应用于生成式AI模型,实现了前所未有的图像生成方式。
这项研究的核心在于一种全新的光学生成式模型,该模型结合了数字编码器和光学解码器的优势。数字编码器负责将随机噪声转化为相位图案,这些图案随后被用作光学生成的“种子”。而光学解码器则利用自由空间传播的原理,对这些种子进行全光学处理,最终生成符合预期数据分布的图像。
研究团队展示了这种模型在生成手写数字、时尚产品、蝴蝶、人脸以及艺术品(如梵高风格画作)等方面的能力。这些图像不仅单色与多色兼备,而且质量媲美传统的基于数字神经网络的生成式模型。这一成果标志着光学与光子学在AIGC领域的潜力得到了进一步挖掘。
据悉,该研究成果已发表在权威科学期刊《自然》上。论文中详细介绍了光学生成式模型的工作原理和实验过程。研究团队指出,这一模型有望为节能且可扩展的推理任务开辟新路径,同时,光学系统与机器学习方法的融合也可能在增强现实(AR)和虚拟现实(VR)领域发挥重要作用。
法国国家科学研究中心FEMTO‑ST研究所的研究员Daniel Brunner对这一成果给予了高度评价。他认为,这项研究具有重要的技术与科学意义,是迈向利用非常规物理系统构建生成式计算模型的重要一步。Brunner还指出,由于光子处理信息具有天然优势,光学生成式模型未来有望具备生成三维图像的潜力。
然而,尽管光学生成式模型展现出了巨大的潜力,但其未来发展仍面临诸多挑战。其中之一是如何实现模型的完全落地。研究团队表示,要使未来的光学生成式模型更强、更灵活,可能还需要构建同时采用光学编码器与光学解码器的模型,并尝试构建多层解码系统,运用更复杂的光学现象。
尽管如此,这一研究仍为生成式AI领域带来了新的希望和机遇。通过结合光学原理和数字技术,研究人员已经成功地让光“动手画画”,生成了具有特定特征的全新图像。这一成果不仅推动了AI技术的边界,也为未来的图像生成和显示技术提供了新的思路。