ITBear旗下自媒体矩阵：

滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

京东开源全球首个全栈实时视频视觉语言交互模型JoyAI-VL-Interaction 赋能多场景AI助手

时间：2026-06-23 06:45:12 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

京东近日正式开源了全球首个全栈开源的实时视频视觉语言交互模型——JoyAI-VL-Interaction，并获得vLLM-Omni的day-0原生支持。这一创新模型标志着大模型交互方式从传统的“一问一答”模式向“边看边说”的动态交互迈出了重要一步，为开发者构建具备持续观察、自主判断和即时响应能力的实景AI助手提供了全新框架。

与传统模型依赖用户发起问题后才开始处理画面的被动模式不同，JoyAI-VL-Interaction具备主动判断能力。它能够持续观察视频流，自主分析场景变化，无需等待指令即可决定何时需要输出信息或保持沉默。这种特性在安防监控、老人看护等需要实时响应的场景中具有显著优势，避免了因延迟导致的风险或体验下降。

在实时性方面，该模型突破了传统视频理解需上传完整文件后再分析的限制。针对安防预警、实时翻译、直播解说等对时间敏感的场景，JoyAI-VL-Interaction可对正在发生的视频流进行即时处理，画面变化时立即响应，确保信息传递的时效性。例如，在直播带货场景中，模型能实时识别商品特征并生成解说内容，提升互动效率。

模型还引入了“适时智能体委托”机制，通过前后台协同优化任务处理效率。当遇到生成代码、复杂推理等需要高算力支持的任务时，前台模型可将任务委派给后台大模型或Agent，自身继续保持对现场的观察。任务完成后，结果无缝融入对话流程，实现观察与交互的并行处理。这种设计既保证了响应速度，又提升了复杂任务的处理能力。

在技术适配性上，JoyAI-VL-Interaction支持摄像头、直播流、监控流等多种视频输入方式，并兼容语音输入输出、可视化界面、长期记忆等功能。开发者可根据需求灵活替换ASR语音识别、TTS语音合成、后台模型等组件，甚至接入自定义业务系统或前端界面。这种模块化设计降低了技术整合门槛，加速了应用落地速度。

目前，该模型已在监控预警、实时计数、直播导览等58个真实流式场景中完成评测。对比豆包视频通话助手，JoyAI-VL-Interaction总体胜率达77.6%；与Gemini视频通话助手的对比中，胜率提升至87.9%。这些数据验证了模型在视觉触发响应和实时性方面的优势，为其在安防监控、电商导购、操作指导、AI眼镜、无障碍辅助等领域的商业化应用奠定了基础。

更多>同类资讯

阿里再推新作！HappyHorse1.1视频生成模型五大能力显著提升

与此前发布的1.0版本比较，该版本在动态表现力、主体一致性、指令遵循、视觉质感和音频能力等维度系统性升级。与此前发布的1.0版本比较，该版本在动态表现力、主体一致性、指令遵循、视觉质感和音频能力等维度系统性升…

06-23

马云携阿里核心管理层插秧团建，以团结之姿稳市场信心与人心

据新浪科技6月22日下午消息，阿里巴巴合伙人、高德董事长刘振飞在内网发帖《手里有秧，才能确保未来有粮》，记录了阿里管理层的插秧团建。活动照片显示，马云、吴泳铭、邵晓锋、蒋凡、吴泽明、蒋芳等人悉数到场；蚂蚁集…

06-23

石家庄阿里巴巴国际站：冀南企业跨境出海优选，官方授权服务助力品牌腾飞

该中心的服务内容包含阿里巴巴国际站开店入驻、选品分析及运营指导、谷歌独立站与海外社媒营销推广、小满CRM客户管理及AI智能获客系统、accio work企业级外贸智能体算力销售，同时可提供AI外贸全链路数字…

06-23

马云携阿里蚂蚁高管下田插秧，刘振飞借田间劳作传递企业发展之道

红星资本局6月22日消息今天，阿里巴巴合伙人、高德董事长刘振飞在阿里内网发文《手里有秧，才能确保未来有粮》，文章记录了近日阿里管理层在杭州一次下田插秧的团建活动。阿里巴巴首席科学家周靖人，也出现在插秧现场。…

06-23

雷军刘震云对谈AI：可辅助创作但难取代人类，创新仍是核心价值

紧接着他也点明了AI的底层局限，AI所有产出依赖的大数据本质上全是沉淀下来的过往知识，不管对创作者还是企业家来说，最核心的能力永远是创新，而创新恰恰是要在过去的基础上，造出原本完全不存在的全新事物，这部分能…

06-23

雷军谈“过早”争议与流量现象忆赌局直言后悔曾与董明珠开玩笑

雷军直言：“在今天这个流量的时代，可能夸你有流量，骂你也有流量，嘲讽你更有流量，这可能是当下时代，我们都要承受的代价。” “2013年我参加央视一个活动，我跟格力的董明珠董大姐打了个赌，本来就打个赌，本来开…

06-23

马云携阿里高管下田插秧，以农耕之态诠释AI战略的深耕与坚守

看到这里，可能有不少网友已经在问：阿里这是吃饱了撑的？阿里目前在AI领域的布局已经覆盖了从自研芯片、云计算基础设施、通义千问开源大模型，到电商、办公、出行等具体场景落地的完整全栈链条。所以，这次的插秧团…

06-23

马云领衔阿里高层下田插秧，蒋凡周靖人等现身，团建激发团队新活力

红星资本局6月22日消息，今天，阿里巴巴合伙人、高德董事长刘振飞在阿里内网发文《手里有秧，才能确保未来有粮》，文章记录了近日阿里管理层在杭州一次下田插秧的团建活动。活动照片显示，此次插秧团建的“同事们”阵容…

06-23

阿里团建插秧暗藏玄机：新老搭配、协同共进与人才稳定全展现

近日，阿里管理层集体下田插秧的照片在网络流传。蒋凡和吴泽明两位80后新晋委员会成员，代表着阿里管理团队的年轻化方向。尤其是其中邵晓锋的角色，体现了另一种制度设计的智慧——他今年年满60岁，按照阿里合伙人制…

06-23

马云等阿里高层下田插秧，阿里管理层团建传递团结乐观信号

每日经济新闻记者获悉，今天（6月22日），阿里巴巴合伙人、高德董事长刘振飞在阿里内网发文《手里有秧，才能确保未来有粮》，文章记录了近日阿里管理层在杭州一次下田插秧的团建活动。阿里巴巴首席科学家周靖人，也出现…

06-23

7英寸大屏成新趋势？三家主流品牌新机或跟进，大屏体验再升级

6月22日，数码博主@数码闲聊站爆料某品牌迭代旗舰Pro系列正在测试新一代2K级超清显示与防窥显示技术，该机大概率为小米 18 Pro。目前行业主流旗舰普遍采用6.8-6.9英寸大屏规格，iPhone 1…

06-23

红米K90至尊版新机来袭：骁龙8至尊版加持，游戏性能全面升级待发布

随着游戏不断发展，推出游戏手机的品牌越来越多，比如红米、iQOO、一加、荣耀等，而且大部分机型为高端/旗舰级别，确保游戏流畅运行，甚至是高画质+高帧率。新机处理器，调整为骁龙8至尊版，并非是天玑芯片，与上一…

06-23

小米YU7 GT自动驾驶首破纽北纪录，极限挑战彰显技术实力与无限可能

对比人类驾驶模式，当前自动驾驶圈速慢约3分7秒，这凸显了系统在动态决策、极限操控与复杂路况处理方面的巨大提升空间与未来潜力。平台技术：基于小米自研897V碳化硅高压平台打造，通过高效电驱与轻量化设计实现性能突…

06-23

小米YU7 GT闪耀纽北：自动驾驶圈速新纪录10分29秒483诞生

小米汽车于6月22日宣布，旗下高性能车型小米YU7GT在德国纽博格林北环赛道（纽北）创造了全球首个自动驾驶圈速纪录，成绩定格在10分29秒483。关键里程碑4月24日：小米集团创始人、董事长兼CEO雷军在北京…

06-23

小米YU7 GT纽北赛道破纪录：自动驾驶邂逅高性能，开启智能驾驶新征程

小米汽车近日宣布，旗下的YU7GT在德国纽伯格林北环赛道创下全球首个自动驾驶圈速纪录，成绩为10分29秒483。这一成就标志着自动驾驶技术首次在被称为“绿色地狱”的高难度赛道上完成了完整的圈速挑战。官方还同步…

06-23

点击查看更多 +

全站最新

小米YU7 GT自动驾驶破冰纽北：极限锤炼，只为守护日常极端路况行车安全

小米YU7 GT闪耀纽北：自动驾驶圈速登顶，SUV组别纪录大幅刷新

小米YU7 GT纽北再创佳绩！10分29秒483刷新全球自动驾驶圈速纪录

雷军跨界对谈再忆赌约：与董明珠“玩笑”成真，直言后悔当时冲动之举

雷军谈高频直播：清者自清已失效，以热爱为底气展小米汽车真实力

7月1日起两项电车新国标实施！安全要求升级保障出行无忧

热门内容

本栏最新

小米YU7 GT自动驾驶破冰纽北：极限锤炼，只为守护日常极端路况行车安全

小米YU7 GT闪耀纽北：自动驾驶圈速登顶，SUV组别纪录大幅刷新

小米YU7 GT纽北再创佳绩！10分29秒483刷新全球自动驾驶圈速纪录

雷军跨界对谈再忆赌约：与董明珠“玩笑”成真，直言后悔当时冲动之举

雷军谈高频直播：清者自清已失效，以热爱为底气展小米汽车真实力

小米YU7 GT勇闯纽北赛道，无人驾驶创官方圈速纪录新篇章

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.