ITBear旗下自媒体矩阵:

从"无名之辈"到行业头部:可灵AI以"敢"破局,用技术愿景重塑视频生成未来

   时间:2026-04-09 09:54:45 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

快手可灵AI负责人盖坤在接受媒体专访时,首次披露了这款现象级产品从技术突围到全球领先的完整历程。其核心团队通过两次关键决策,在视频生成赛道实现"后来者居上",更重新定义了AI时代的技术创新范式。这款让全网播放量破亿的《纸手机》背后的技术引擎,正以独特路径改写行业规则。

2024年OpenAI发布Sora Demo引发的行业震动尚未平息,可灵团队却做出惊人决定:在资源极度匮乏的情况下,用5个月时间打造全球首个可商用的视频生成模型。盖坤回忆当时场景:"内部反对声几乎掀翻屋顶,但我们判断OpenAI会因战略重心转移留下半年窗口期。"这个充满赌性的决策,让团队在6月6日成功推出可灵1.0版本,比Sora正式发布提前整整半年。

技术突破带来的首战告捷,很快将团队推向更艰难的十字路口。在2.0版本研发阶段,盖坤力排众议放弃"优化现有指标"的安全路线,转而押注多模态交互的未知领域。这个选择催生出颠覆性的动作控制功能——用户上传参考视频即可让角色精准复刻动作。该功能在海外社交平台引发病毒式传播,验证了"重构交互方式"的战略前瞻性。

"OpenAI像高高在上的神庙,我们选择做接地气的工匠。"盖坤用生动比喻揭示竞争策略的本质差异。可灵团队摒弃互联网时代盛行的AB测试方法论,转而建立"愿景驱动+极致执行"的创新体系。从DiT架构选择到一体化模型研发,关键技术路径均通过少数人的战略判断确定,而非传统意义上的试错验证。

这种创新模式对组织能力提出全新要求。盖坤推行的"Disagree and Commit"原则,允许团队在决策初期充分争论,但目标确定后必须全情投入。他特别强调执行环节的"变形控制":"很多团队败在口头共识与实际行动的割裂,我们要确保每个齿轮都精准咬合。"这种管理哲学支撑可灵在短短18个月内完成三次重大技术转向。

技术突破带来的商业价值正在显现。最新财报显示,可灵AI在2025年第四季度实现营收3.4亿元人民币,12月单月收入突破2000万美元。但盖坤更看重技术普惠的社会价值:"当AI视频生成成为基础设施,每个普通人都能成为导演。"他透露团队正在研发新一代故事引擎,未来用户只需输入文字描述,即可自动生成包含分镜、运镜和角色表演的完整视频。

这个让小男孩为逝去奶奶制作"纸手机"的技术平台,正在重塑内容创作生态。盖坤展示的测试案例中,偏远地区教师用AI生成历史场景视频辅助教学,非遗传承人通过动态影像让传统技艺重焕生机。这些应用场景印证着他的判断:AI视频革命的核心不是替代人类,而是释放每个个体的表达潜能。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version