新一代算力芯片领域迎来里程碑式进展——上海交通大学集成电路学院研究团队成功开发出国际首款支持大规模语义媒体生成的全光计算芯片。该成果以"All-optical synthesis chip for large-scale intelligent semantic vision generation"为题,登上国际顶级学术期刊《科学》封面,标志着光计算技术正式迈入大规模生成式人工智能应用阶段。
面对深度神经网络规模指数级增长带来的算力危机,传统电子芯片架构已难以满足AI模型训练需求。研究团队创新提出全光大规模语义生成芯片LightGen架构,通过百万级光学神经元集成技术、全光维度转换机制及无真值训练算法三大突破,首次在单一芯片上实现了从图像输入到语义理解、再到全新媒体生成的完整端到端处理流程。这一成果突破了传统光计算芯片仅能处理简单分类任务的局限,使光子具备直接"理解"复杂语义的能力。
实验数据显示,LightGen在512×512分辨率图像生成、3D场景重建(NeRF)、高清视频生成等12类生成任务中,生成质量与Stable Diffusion等主流电子神经网络相当,但能耗显著降低。在采用商用输入设备条件下,该芯片较顶尖数字芯片实现2个数量级的算力提升和2个数量级的能效优化;若配备前沿光子输入系统,理论算力可跃升7个数量级,能效提升达8个数量级。这种性能飞跃源于光子传输的天然并行性优势——光速传播特性使芯片内部数据交互延迟趋近于零,同时避免了电子芯片中的电阻热损耗。
研究团队特别设计了严苛的测试标准,通过直接测量整个系统的端到端能耗,排除了外围电路对性能评估的干扰。在语义调控实验中,LightGen成功实现了对生成图像的局部特征修改与全局风格迁移,其生成的采样图像经专家评估,在细节丰富度、语义一致性等指标上达到行业领先水平。这种能力使芯片可直接应用于自动驾驶场景实时建模、医疗影像动态生成等对时延敏感的领域。
该成果的突破性不仅体现在技术指标上,更在于构建了光计算与数字系统无缝衔接的桥梁。研究团队此前开发的ACCEL全模拟光电芯片已验证光计算在复杂智能任务中的系统级优势,而本次LightGen架构进一步将应用范围扩展至生成式神经网络。目前,团队正与产业界合作推进芯片的工业化落地,重点攻关光子输入模块的工程化难题,预计三年内可实现特定场景的商业化部署。
学术界对该成果给予高度评价。《科学》期刊审稿人指出,这项研究解决了大规模光计算芯片集成度、维度变换、训练算法三大核心难题,其提出的无真值训练方法为光计算领域开辟了新范式。随着生成式AI加速渗透各行各业,这种兼具超高算力与能效的新型芯片架构,有望成为破解"算力焦虑"的关键技术路径。











