滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

AI语音赛道新星Cartesia获英伟达等1亿美元融资斯坦福华人团队携Sonic-3模型入局

时间：2025-11-04 15:43:32 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

美国语音生成领域迎来重要突破——初创企业Cartesia正式推出新一代语音模型Sonic-3，并宣布完成1亿美元战略融资，英伟达成为核心投资方。这款采用非Transformer架构的模型，凭借其低延迟特性在实时语音交互领域引发关注，数千家企业已将其应用于每月数百万次的对话处理。

技术团队构成堪称"学术全明星"：由5位斯坦福AI实验室研究员创立的Cartesia，其核心成员包括Mamba架构主要开发者Albert Gu、前谷歌大脑工程师Brandon Yang，以及拥有斯坦福与卡内基梅隆双重学术背景的CEO Karan Goel。团队将状态空间模型（SSM）研究成果转化为商业应用，Albert Gu更凭借技术贡献入选《时代》杂志2024年全球影响力人物榜单。

与传统Transformer模型不同，Sonic-3采用的SSM架构通过持续理解对话脉络实现高效预测。实测显示，该模型中文生成响应时间仅2秒，虽流畅度待提升，但英文表现已达自然水准，纪录片旁白测试中几乎无法分辨AI痕迹。其90毫秒的模型延迟与190毫秒内端到端响应，使系统跻身全球最快实时语音AI之列。

功能层面，Sonic-3支持42种语言与500余种音色选择，中文提供10种声线，英文细分为11种地域口音。通过API参数与SSML标签，用户可精确控制音量、语速及情感表达，甚至实现笑声、语调等微妙情感转换。新增的语音克隆功能支持微调，使生成语音更贴近参考原声，自动缓冲技术则显著提升实时交互的流畅性。

商业应用方面，Cartesia构建的企业级平台集成文本转语音（Sonic）与语音转文本（Ink）模型，支持客户构建具备复杂任务处理能力的语音Agent。ServiceNow等企业已将其用于客户支持、日程管理等场景，产品副总裁Ravi Krishnamurthy评价称："SSM架构为企业级应用带来了前所未有的速度与质量。"

融资进程显示市场高度认可：2024年12月获Index Ventures领投的2700万美元种子轮融资后，仅隔3个月便完成6400万美元A轮融资。此次1亿美元战略融资将加速技术迭代，在MiniMax、ElevenLabs等竞争对手环伺的AI音频生成赛道，Cartesia正以SSM架构开辟差异化竞争路径。

更多>同类资讯

小沈阳一鱼两吃！去年乐道，今年理想

05-22

高德副总裁董振宁：AI正从被动的「信息载体」蜕变为主动的「行动伙伴」

05-22

未成年视角演绎弑亲装箱！重口AI剧公然挑战公序良俗

05-22

微信回应只能撤回2分钟内消息：撤回不限时，发送者就能随意篡改聊天记录

05-22

永辉超市：向王健林、孙喜双等追债超36亿元

05-22

老虎回应遭证监会立案：将严格按照监管要求积极配合相关工作，目前公司各项业务运营正常

05-22

富途回应：中国内地有资产客户数占比已降至13%

05-22

研报掘金丨开源证券：维持爱旭股份"增持"评级，ABC海外出货占比提升

05-22

中国证监会等八部门联合出手！整治非法跨境证券期货基金经营活动

05-22

品渥食品：吴柏赓累计减持1145.34万股，持股比例降至7.30%

05-22

国城矿业：拟23.68亿元购买国城实业40%的股权，提升钼矿资源储量的权益占比

05-22

东芯股份：拟发行H股并在香港联交所主板上市

05-22

浙江世宝：世宝控股累计减持1.11% 持股比例降至35.00%

05-22

老虎国际：内地客户资产占比约10%

05-22

数字政通：拟投资1亿元设立全资子公司推动公司向AI算力与大模型运营商转型

05-22

点击查看更多 +

全站最新

阿里云峰会释放关键信号：Agent为核心，云与AI融合开启新篇章

AI赋能小微企业：一人借力AI工具，解锁多岗运营新效率密码

小米YU7上市10个月交付23.2万台发布会新增三色两款轮毂标准版将至

华为阅读AI赋能：眼动翻页、视感动图，数字阅读体验焕新升级

4月新能源二手车市场生变：问界保值率登顶，蔚来垫底，谁更值得买？

直播电商新引擎：国货品牌如何借力直播间驶向增量新蓝海？

热门内容

本栏最新

艾立罗电子携多款测试设备亮相2026上海CPSE展助力新能源发展

别再只换机油！每月花5分钟清理这2处，车子动力足油耗低开不坏

爱奇艺2026年首季财报重返亏损，AI与海外拓展能否成破局关键？

法拉利HC25惊艳亮相：传承经典融合创新，开启定制超跑新篇章

刹车技巧用不对，行车风险翻几倍！这几个误区90%车主都中招

博泰车联张杰揭秘：智能座舱AI Agent量产，算力架构成关键要素

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

AI语音赛道新星Cartesia获英伟达等1亿美元融资 斯坦福华人团队携Sonic-3模型入局

AI语音赛道新星Cartesia获英伟达等1亿美元融资斯坦福华人团队携Sonic-3模型入局