滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

京东全球首开源全栈实时视频交互模型JoyAI-VL-Interaction 助力开发者打造实景AI助手

时间：2026-06-22 17:16:57 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

京东近日正式对外发布全球首个全栈开源的实时视频视觉语言交互模型——JoyAI-VL-Interaction，该系统获得vLLM-Omni框架的day-0原生支持，标志着人工智能在多模态交互领域取得重要突破。这一创新模型突破了传统AI助手的被动交互模式，通过持续观察视频流实现自主判断与实时响应，为开发者构建实景AI应用提供了全新范式。

与传统模型依赖用户提问才能启动分析不同，JoyAI-VL-Interaction具备主动认知能力。系统可持续监控视频画面变化，自主决定何时需要发出提醒或保持静默。在安防监控场景中，该模型能实时识别异常行为并立即预警；在直播解说场景中，可自动捕捉精彩瞬间并生成解说词，无需人工触发指令。这种主动交互模式使AI应用从"问答式"升级为"陪伴式"，显著提升了用户体验的流畅度。

实时性是该模型的另一核心优势。通过优化视频流处理架构，系统能在画面变化时同步响应，延迟控制在毫秒级。在实时翻译场景中，可实现跨语言对话的无缝衔接；在工业操作指导场景中，能即时纠正操作人员的错误动作。测试数据显示，在58个真实流式场景评测中，该模型相比豆包视频通话助手的胜率达77.6%，较Gemini视频通话助手高出87.9%，尤其在视觉触发响应和实时处理能力上表现突出。

针对复杂任务处理需求，研发团队设计了智能体委托机制。当模型遇到代码生成、工具调用等超出处理能力的任务时，会自动将任务委派给后台大模型或专用Agent，同时保持前台对视频流的持续观察。任务完成后，系统能自然衔接对话上下文，实现前后台的无感知切换。这种设计既保证了实时响应能力，又拓展了模型的应用边界。

该系统提供高度模块化的开发接口，支持摄像头、直播流、监控流等多种视频输入，兼容语音交互、可视化界面、长期记忆等功能模块。开发者可自由替换ASR语音识别、TTS语音合成、后台模型等组件，快速集成自有业务系统。目前已有安防监控、老人看护、直播导购、操作指导等十余个行业应用案例，未来还可拓展至AI眼镜、无障碍辅助等可穿戴设备领域。

技术文档显示，JoyAI-VL-Interaction支持vLLM部署方案，可灵活适配不同算力环境。其开源架构包含完整的训练代码、推理引擎和示例应用，开发者既能基于现有框架快速开发，也能进行二次创新。这种开放策略有望推动实时视频交互技术加速普及，为智能助手领域带来新的发展机遇。

更多>同类资讯

雷军刘震云对谈AI：能辅助创作难替代核心价值，创新仍是人类专属

紧接着他也点明了AI的底层局限，AI所有产出依赖的大数据本质上全是沉淀下来的过往知识，不管对创作者还是企业家来说，最核心的能力永远是创新，而创新恰恰是要在过去的基础上，造出原本完全不存在的全新事物，这部分能…

06-22

亚马逊AI主管：已就向外部出售实体Trainium芯片进行商谈

06-22

智谱盘中总市值突破1万亿港元，年内涨超1900%

06-22

雷军再谈1300公里只充一次电争议：言论被断章取义很无奈

06-22

小米YU7 GT达成全球首个纽北自动驾驶圈速纪录

06-22

徐洁云回应雷军过早摆拍：工作之余拍Vlog已经两年了

06-22

一个程序员的自白：用10年搭起的三根职业支柱，全要倒了

06-22

多款电脑机型近一月上涨千元！经销商：根本不敢囤货

06-22

豆包App灰测打车功能，由曹操出行提供服务

06-22

雷军再谈与董明珠打赌：只是开玩笑，没想到被激怒了

06-22

雷军回应经常直播：清者自清不管用了

06-22

雷军的真实感快过期了

06-22

家电ETF博时159730开盘微涨0.30% 格力海尔等重仓股表现分化

来源：新浪基金∞工作室 6月22日，家电ETF博时（159730）开盘涨0.30%，报1.015元。家电ETF博时（159730）重仓股方面，格力电器开盘涨0.03%，美的集团跌0.86%，三花智控跌0.13…

06-22

AI领域风云再起：谷歌Gemini技术联席负责人沙泽尔转战OpenAI引关注

06-22

苹果与LM Studio强强联手：四台Mac Studio集群让万亿参数大模型本地化流畅运行

06-22

点击查看更多 +

全站最新

雷军刘震云对谈AI：能辅助创作难替代核心价值，创新仍是人类专属

未来外贸企业新格局：获客、信任、经营能力成制胜关键要素

零跑三款C系列新车上市，以豪华配置重塑主流新能源家用SUV新格局

新款兰博基尼Revuelto SV或年内亮相赛道性能升级谍照曝光

比亚迪大唐强势登场，纯电续航亮眼，增程大车市场或迎新变局

比亚迪腾势N8L闪充版明日上市，大六座豪华SUV配刀片电池与AI座舱

热门内容

本栏最新

雷军刘震云对谈AI：能辅助创作难替代核心价值，创新仍是人类专属

海清智元6月22日港交所主板上市，首挂涨幅亮眼市值超200亿港元

黄仁勋“自然亲民”与雷军“设计亲民”：AI时代下的企业家形象之辨

喜欢合资轿车别错过！这三款车配置足舒适佳还省油，闭眼入不踩雷

暑期回国研学新选择：北上深杭科技之旅，让孩子边玩边学收获满满

科大讯飞Fika阅读器：轻薄机身搭配优质墨水屏，开启舒适便捷阅读新体验

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.