在深圳理工大学的一间实验室里,一位穿着格子衬衫和工装裤的科学家正专注地敲击着键盘,办公桌旁停着一辆折叠自行车。他就是唐志敏,一位在中国芯片领域留下深刻印记的传奇人物。从“龙芯一号”的发起者,到海光信息的缔造者,再到如今象帝先的掌舵人,唐志敏亲历了中国芯片从无到有、从弱到强的全过程。
唐志敏的科研生涯始于中国科学院计算技术研究所。1985年,19岁的他进入该所攻读博士研究生,师从被誉为“中国计算机之母”的夏培肃院士。1990年,唐志敏成为夏培肃院士的第一批博士毕业生,此后他陆续为国家培养和引入了大批顶尖人才,包括现任中科院计算所总工程师的胡伟武,寒武纪创始人陈天石、陈云霁等。可以说,唐志敏师门一脉,几乎撑起了目前国产芯片的半壁江山。
上世纪90年代,超级计算机被称为“国之重器”,但CPU清一色来自国外,供应链随时可能断供,且CPU设计受制于英特尔架构,国家的所有数据都运行在国外芯片上,存在巨大的风险和隐患。这些因素成为唐志敏决心做自研芯片的原始推动力。2000年,他发起筹备自研CPU项目,“龙芯”课题组正式成立。2002年8月,我国首枚通用CPU“龙芯1号”问世,终结了中国信息产业的无“芯”历史。
此后20年间,唐志敏在国产CPU研发的关键进程中均担当了核心人物。他参与了龙芯2号、龙芯3号的系列迭代;2015年,加入中科曙光担任CTO,与AMD合作并引进核心技术;2016年,中科曙光孵化出海光信息,他又出任了海光信息总裁。截至目前,海光信息已成为一家市值可观的企业。
然而,唐志敏并未满足于此。2020年,55岁的他做出了一个重要决定:从海光辞职,创立象帝先,一头扎进全新GPU领域。他以《道德经》“象帝之先”为名,立志攻克国产独立GPU,补齐中国在图形渲染、端侧AI与通用计算领域的最后一块短板。凭借行业声望与技术号召力,他迅速集结了百人核心团队,5年间拿下约25亿元融资,团队规模扩张至近700人。
象帝先专注于高性能GPU芯片的研发与创新,在图形处理、AI计算加速方面都有应用。其产品可用于服务器、工作站、PC、嵌入式等领域,完成3D建模、影视特效渲染、仿真模拟、云游戏、大规模视频转码等业务。创业之初,唐志敏和团队一致认为,中国GPU产业最大的问题并不是算力不够,而是软件生态。英伟达用了几十年把CUDA打造成了全球AI开发者的标准语言,任何新进入者都无法绕过这道墙。而唐志敏锚定的,就是生态,不追求单一AI维度的算力竞赛,而是集图形处理、AI计算于一体的专业GPU。
在技术路线上,唐志敏是一个坚定的长期主义者,比起速度,更看重“稳”。2022年初,象帝先在第一代盘古架构下完成了芯片流片,主要锚定于图形渲染。2022年末,ChatGPT横空出世,行业剧变,大语言模型爆火,算力成为大模型军备赛的关键资源,英伟达市值翻升。国内同行纷纷押注大算力训练芯片,但象帝先依然在打磨图形渲染的兼容性和软件体验。
面对客户、投资人甚至是团队成员“为什么不搞AI”的疑问,唐志敏表示,GPU本来就可以加上AI功能,没必要放弃现在的场景,重新去做一个AI芯片。事实上,象帝先第二代、第三代架构均已规划加入AI计算,以此实现端侧AI。2024年,象帝先成功研制第二代架构“伏羲”,目前主要有两大产品线:一是基于伏羲A0架构的“天钧”系列桌面GPU显卡,性能接近英伟达2070/3050芯片,并于近期实现量产和销售;二是伏羲系列主做高端图像渲染的端侧GPU,即应用于自主机器人和边缘计算设备的端侧加速芯片“伏羲B0”,也于近期完成全部设计,成为国内首款面向AIPC及边缘计算设备的端侧推理、智能视频处理芯片。
然而,创业之路并非一帆风顺。2024年8月,由于B轮一笔重要的融资未能如期到位,象帝先进行了阶段性的裁员降薪。一时间,社交媒体上充斥着被裁员工的抱怨。但唐志敏并未放弃,他和团队排查所有通道,一一尝试找到解决方案。2024年12月底,象帝先完成新一轮4.5亿元融资,这笔钱结清了被裁员工的欠薪,也盘活了“伏羲”架构下“天钧三号GPU”的量产线。
资金到位后,研发再次步入快速轨道。目前,象帝先已经进入稳健融资、研发迭代的发展节奏。据悉,象帝先已完成预研“神农A0”高端图形渲染芯片,其将采用4nm先进制程,且性能可达到NVIDIA高端图形卡水平,并计划近期流片,未来实现高端图形渲染市场国内占有率第一。
在象帝先高歌猛进的同时,国产GPU赛道也开始群雄逐鹿。资本热衷于听“中国英伟达”的故事,但有志于成为英伟达的中国公司已有很多。在算力GPU场域内,摩尔线程、沐曦股份、天数智芯、壁仞科技已上市,燧原科技正排队上市,还有新玩家曦望、芯桥半导体等,独立芯片设计公司已超10家。国产GPU集中上市,标志着行业从一级市场依赖转向公开市场输血,也预示着赛道进入白热化竞争阶段。
同时,独立芯片设计公司的生存空间也在被挤压,华为、阿里、百度、字节都在启动自研AI芯片、GPU,它们中有的既是象帝先的客户又是竞争者。唐志敏承认,独立的芯片公司“会越来越难”。“钱”成为核心掣肘因素,消费级GPU市场技术更新周期约18 - 24个月,高研发投入加上技术迭代期长,对企业资本提出更高要求。更难的在于技术,在生态兼容方面,消费级GPU场景需要适配海量的3A游戏、专业设计软件和各类应用程序,而英伟达CUDA生态已形成牢固壁垒。
不过,技术方面国产消费级GPU进展迅猛。龙芯中科首款自研独显芯片“9A1000”已完成流片,且图形性能大致相当于AMD RX550水平;摩尔线程发布新一代GPU架构“花港”,其内置AI生成式渲染架构,可增强硬件光线追踪加速引擎,完整支持DirectX 12 Ultimate,实现图形渲染与智能计算的高度协同。业内人士看来,目前象帝先最大的优势是All in于图形GPU,其差异化路径在于“图形渲染 + AI推理”的融合定位,这与当前AI应用从云端向端侧迁移的行业趋势相契合。
当被问及这一路最有成就感的时刻是什么时,唐志敏讲了一个36年前刚博士毕业,担任一名助理研究员的小故事。那时,与微电子部门合作研制运算芯片时遇到了一个问题:一个芯片项目中的布线任务难以跑通。被逼无奈时,唐志敏在设计工作站上安装了C语言编译器,临时“手搓”了一个调整芯片内元件布局的EDA工具。熬了几个大夜后,凭借这个小样EDA,唐志敏在第二次尝试时就流片成功。自那时起,唐志敏认定,一切看起来“不可能”的事,都有机会成为“可能”。






