第八届全球人工智能与机器人大会近日在深圳举办,作为AI领域产学研投界的重要活动,本次大会聚焦算力体系变革对产业发展的深远影响。在“AI算力新十年”专场论坛中,深圳理工大学算力微电子学院院长唐志敏发表主题演讲,深入剖析了异构计算架构的发展趋势与生态建设的关键作用。
唐志敏指出,传统“算力”概念正被重新定义。随着人工智能技术突破,训力(模型训练能力)与推力(推理生成能力)等新型算力形态加速涌现。未来可能出现将语言理解、视频生成、图形渲染等能力融合的“全栈算力”,这种演进对底层计算架构提出全新要求。当前单靠CPU已无法满足生成式AI的算力需求,CPU+XPU的异构计算模式成为必然选择,但硬件性能提升需与软件生态协同发展。
针对异构计算面临的编程复杂性与生态兼容性挑战,唐志敏通过架构分类进行解析:激进型架构依赖硬件动态优化,保守型架构通过软件调度计算资源,而理想方案需实现动静结合。他强调,XPU作为保守型架构的代表,其性能释放高度依赖软件栈的成熟度。自动并行化技术虽经数十年研究仍效果有限,实际性能优化仍需经验丰富的工程师团队与完整工具链支持。
在生态竞争层面,x86架构凭借四十年积累形成强大惯性。数据显示,全球x86软件市场规模达3000亿美元,年度开发投入超600亿美元,远超服务器硬件销售收入。这种生态壁垒使得Arm架构服务器屡战屡败,即便强如苹果的端云融合策略也难以直接复制。RISC-V虽具备开放优势,但商业化进程面临双重困境:软件生态建设滞后导致应用场景受限,硬件成熟度不足迫使企业重复购买Arm的片上互联技术。
CUDA生态的护城河效应成为典型案例。英伟达通过构建包含算力库、开发工具的完整体系,形成难以复制的技术壁垒。尽管兼容CUDA接口相对容易,但生态迁移成本高昂。国家层面已启动自主生态建设,旨在打破对单一技术路线的依赖。唐志敏特别指出,GPGPU发展需兼顾计算与渲染能力,避免陷入“能算不能绘”的异化陷阱,这对实现AIGC全场景覆盖至关重要。
芯片产业正经历螺旋式发展周期。系统厂商自研芯片的成功关键在于能否形成差异化增值。苹果通过芯片-软件-体验的闭环生态,成功实现高端市场溢价。反观部分企业的自研尝试,因缺乏全栈掌控能力而折戟沉沙。唐志敏建议,行业应聚焦RISC-V指令集的统一化发展,避免重复造轮子。该架构的模块化特性使其具备融合CPU、GPU、AI加速器的潜力,或将成为突破CUDA生态封锁的重要路径。
针对技术路线选择,唐志敏提出“架构创新无需新指令集”的观点。现有指令体系已能支撑创新需求,RISC-V的开放性足以承载多元探索。他呼吁产业界减少低水平重复投入,将资源集中于软件生态建设。随着异构计算向新一体化架构演进,具备生态包容性的技术路线将主导未来竞争格局,这需要产学研各方在系统优化、算法创新等领域开展深度协作。











