滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

中科大与FrameX.AI强强联合：Stream-T1框架让AI长视频生成更靠谱

时间：2026-05-13 02:14:49 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在人工智能视频生成领域，长视频的质量与连贯性始终是难以突破的瓶颈。传统方法往往陷入两难困境：要么依赖堆砌算力训练巨型模型，成本高昂且边际效益递减；要么接受生成结果中人物变形、背景错位、动作断裂等缺陷。中国科学技术大学与frameX.AI联合团队提出的Stream-T1框架，通过创新性的推理时优化策略，为这一难题提供了低成本、高效率的解决方案。

该研究的核心突破在于将"流式生成"与"推理时扩展"深度融合。不同于传统方法将视频视为不可分割的整体，Stream-T1采用分段处理模式，将长视频拆解为多个短片段逐个生成。每个片段仅需4步去噪处理，较传统方法减少90%计算量。这种"边生成边优化"的机制，使系统能在生成过程中实时评估画面质量与叙事连贯性，及时纠正偏差。

为确保片段间的自然过渡，研究团队设计了"流式缩放噪声传播"机制。该机制通过球面插值算法，使新片段的初始噪声包含前序片段的优质特征。数学公式显示，新噪声由前序噪声与全新随机噪声按特定比例混合生成，既保持统计分布的规范性，又实现风格特征的渐进传承。实验表明，该设计使相邻片段间的跳跃感降低62%，人物面部特征保持率提升至89%。

双轨评分系统是保障生成质量的另一关键创新。系统同时运行图像奖励模型与视频奖励模型：前者以帧为单位评估画面美观度，后者通过滑动窗口分析跨片段连贯性。动态加权策略根据生成进度调整评分权重——初期侧重连贯性确保叙事方向正确，后期强化画质要求提升单帧品质。这种平衡机制使生成视频在保持动作流畅的同时，关键帧的视觉质量评分提升47%。

针对长视频生成中的记忆管理难题，研究团队提出"流式缩放记忆沉降"方案。系统通过质量门控与场景切换检测双重筛选机制，智能处理被挤出记忆窗口的旧片段：低质量片段直接丢弃，平稳场景片段采用指数移动平均融合更新，场景切换片段则作为独立锚点保存。这种差异化处理策略使内存占用减少58%，同时将主体一致性评分维持在92%以上。

在5秒与30秒视频生成测试中，Stream-T1展现出显著优势。对比当前先进模型，其30秒视频的动作质量提升达114倍，文字对齐度提高9.39%，视觉质量改善49.47%。特别在长视频场景中，传统模型因动作连贯性崩溃导致评分接近零值，而Stream-T1通过持续优化维持稳定表现，形成百分比增幅的特殊现象。消融实验证实，噪声传播、奖励剪枝、记忆沉降三大组件缺一不可，共同构成系统效能的基础。

该研究为AI视频生成领域开辟了新路径。不同于依赖模型规模扩张的传统思路，Stream-T1通过优化生成策略实现质量跃升，在保持1.3B参数规模的基础上，达到甚至超越更大模型的效果。其分段处理机制与动态记忆管理方案，为处理分钟级超长视频提供了技术储备。目前研究团队已开放项目页面与论文下载，相关代码即将在GitHub平台开源。

更多>同类资讯

宇树科技GD01载人变形机甲发布：技术突破引领商用，科幻照进现实新篇章

05-13

成都创新中心发布首个流形拓扑机器人世界模型推动具身智能迈向新高度

05-13

越疆机器人发布DobotStudio Pro平台助力协作机器人具身智能工程化落地

05-13

软银加码Graphcore：4.57亿美元注资助力，共筑通用AI新蓝图

05-13

美光256GB DDR5内存样品交付合作伙伴助力AI服务器提升能效表现

05-13

千觉机器人：以触觉感知赋能具身智能开启机器人“理解世界”新篇章

05-13

黄仁勋AI投资狂飙：日均砸20亿，背后是生态布局还是泡沫推手？

05-13

企业安全生产管理平台怎么选？苏州同企科技助力多行业数字化风险管控

05-13

特高压线上的“科技卫士”：智能机器人2.0春检首秀精准护航电力动脉

05-13

智造新引擎：人工智能、物联网与机器人如何重塑现代制造业未来

05-13

李想谈AI芯片变革：理想自研马赫M100亮相，四年前选择获强悍验证

5月12日，理想汽车CEO李想今日发文称：“我们现在看到的大多数芯片都是基于冯诺依曼架构，我认为AI时代需求的巨大变化，会推动芯片在架构层面发生巨大变革。”他表示，在PC时代，芯片霸主是英特尔，移动互联网时代…

05-13

AI浪潮下的独特风景：众人怀抱半开电脑只为智能体持续运行

05-13

Hugging Face平台现山寨OpenAI模型项目下载运行或致信息被窃

05-13

美光256GB DDR5内存样品交付合作伙伴，先进技术助力AI服务器能效提升

05-13

从Markdown到HTML：Agent输出变革，Claude工程师揭示新趋势

05-12

点击查看更多 +

全站最新

李想谈AI芯片变革：理想自研马赫M100亮相，四年前选择获强悍验证

比亚迪第三代元PLUS 5月21日上市续航630公里配二代刀片电池与智驾系统

中央网信办推进短视频规范标注 6类必选标签成发布“硬门槛”

微信状态内测“访客记录”引网友热议隐私边界与社交自由成焦点

智启教育新程：数智技术赋能全球教育多元创新与均衡发展

广汽丰田铂智3X：14个月销量破10万蝉联8月销冠香港市场也表现亮眼

热门内容

本栏最新

李想谈AI芯片变革：理想自研马赫M100亮相，四年前选择获强悍验证

李想回应质疑：AI时代自研芯片是突破技术壁垒构建全域能力的关键

汽车产业价值重心转移：供应链崛起，车企角色悄然生变？

理想L9 Livis携自研马赫M100芯片亮相，以AI赋能开启汽车新体验

通用汽车IT部门裁员超600人，为AI人才“腾位”促组织转型

常州具身智能数据实验平台运营开启真实场景数据采集新阶段

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.