ITBear旗下自媒体矩阵:

Taalas“模型即芯片”引热议,是颠覆者还是昙花一现?

   时间:2026-02-25 00:06:42 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

一家名为Taalas的加拿大芯片初创公司,凭借其宣称颠覆英伟达的技术路线,在人工智能领域引发了广泛关注。这家成立于2023年的公司,于近期推出了首款专为AI推理优化的芯片HC1,声称在特定场景下性能远超传统GPU方案,甚至可能重塑AI芯片市场格局。

HC1芯片的核心突破在于其“模型即芯片”的设计理念。与传统ASIC(专用集成电路)仍需通过软件编译将模型转化为芯片指令不同,Taalas直接将特定大模型“刻”入芯片硬件,通过EDA(电子设计自动化)流程将模型转化为定制电路。这种设计使得数据无需在内存和计算单元间频繁移动,理论上可消除“内存墙”瓶颈,显著提升推理速度并降低功耗。据公司披露,采用30芯片集群时,HC1在运行meta开源大模型Llama 3.1 8B时,推理速度可达每秒12000 tokens,能效较传统GPU方案提升50倍,峰值速度更接近17000 tokens/秒,构建成本和功耗分别降至传统方案的1/20和1/10。

Taalas的技术路线与其创始人柳比沙·巴伊奇(Ljubiša Bajić)的背景密切相关。这位曾在AMD担任架构师的业界资深人士,此前创立了AI芯片独角兽Tenstorrent,并主导过开源RISC-V架构的软硬件协同设计。2022年后,巴伊奇联合妻子莱拉·巴伊奇(前AMD系统工程高级经理)及ASIC设计专家德拉贡·伊格纳托维奇(Drago Ignjatovic),组建了Taalas的核心团队,成员多来自AMD、苹果、谷歌等科技巨头。公司成立仅一年便完成5000万美元首轮融资,截至目前已累计融资超2亿美元,资本市场的青睐为其技术探索提供了充足弹药。

HC1的商业化路径清晰而激进:客户提交模型后,Taalas在一周内完成电路设计,再通过台积电代工在两个月内交付定制芯片。这种“模型-芯片”强绑定的模式,在测试中展现出惊人性能。公司宣称,HC1在Llama 3.1 8B上的推理速度是英伟达H200的48倍、B200的34倍,甚至超越了估值230亿美元的ASIC明星企业Cerebras的同类产品。实测演示中,大模型对用户问题的响应速度达到“秒回”级别,引发业界对AI交互体验变革的想象。

然而,HC1的“极致优化”也伴随显著争议。质疑者指出,其测试数据可能基于特定场景的优化,实际通用性存疑。有芯片爱好者分析,HC1或通过预置答案实现“速度秒杀”,但面对动态问题时可能表现不佳。更关键的是,大模型迭代速度远超芯片交付周期——当前顶尖模型的优势窗口仅月余,而Taalas的定制芯片需至少两个月生产,可能导致“芯片未量产,模型已过时”的困境。HC1的“只读”模式限制了模型更新能力,若底层大模型架构发生变革,现有芯片可能面临彻底淘汰的风险。

尽管如此,Taalas的技术方向仍获得部分专家认可。中国科学院计算技术研究所副研究员赵永威认为,其“硬连线”模式代表未来芯片发展趋势,尽管当前应用价值有限,但为后续研究提供了重要参考。科技记者蒂莫西·普里克特·摩根(Timothy Prickett Morgan)则指出,Taalas的芯片更新成本相对模型训练成本微不足道,若主要模型发布间隔延长,其技术或迎来更广阔市场。低延迟、低功耗的特性也使其在边缘计算场景(如机器人、自动驾驶、高端手机)中具备潜力,这些领域对定制化模型的需求与HC1的设计理念高度契合。

面对争议,Taalas已规划技术迭代路线。公司宣布将于今年冬季推出第二代HC2芯片,承诺进一步提升执行速度和性能。同时,巴伊奇透露正在开发适用于中等规模推理模型的产品,试图拓展技术适用范围。然而,要真正挑战英伟达的霸主地位,Taalas不仅需证明其技术在大规模模型中的可行性,还需构建类似CUDA的开发者生态——这或许是比芯片性能更艰巨的长期挑战。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version