滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

苹果推出FastVLM模型试用版，Mac用户可体验超高速视频字幕生成

时间：2025-09-02 08:15:59 来源：IT之家编辑：快讯 IP：北京 发表评论无障碍通道

苹果公司在Hugging Face平台上推出了FastVLM视觉语言模型的浏览器试用版，这一消息由科技媒体9to5Mac在9月1日报道。该模型以其在视频字幕生成上的“闪电般”速度而引人注目，专为搭载Apple Silicon芯片的Mac设备设计。

FastVLM的核心竞争力在于其高效与快速。苹果利用自研的开源机器学习框架MLX对模型进行了优化，使其专为Apple Silicon芯片定制。与同类模型相比，FastVLM的模型体积大幅缩小至三分之一左右，但在视频字幕生成速度上却实现了85倍的提升。这一突破性的性能表现，为用户带来了全新的体验。

此次发布的FastVLM-0.5B轻量版，可以直接在浏览器中加载运行。据实测，在配备16GB内存的M2 Pro MacBook Pro上，首次加载模型需要几分钟时间，但一旦启动，它便能准确识别并描述画面中的人物、环境、表情以及各种物体。

FastVLM模型支持本地运行，所有数据均在设备端处理，无需上传至云端。这一特性极大地保障了用户的数据隐私，为用户提供了更加安全的使用环境。

FastVLM的本地运行能力和低延迟特性，使其在可穿戴设备和辅助技术领域展现出巨大的应用潜力。例如，在虚拟摄像头应用中，该模型能够实时详细地描述多场景内容，为用户提供更加智能、便捷的交互体验。未来，FastVLM有望成为这些设备的核心技术，进一步推动智能设备的发展。

更多>同类资讯

500亿浦发转债完成转股收官资本补充与股权结构优化双丰收

10-29

英伟达发布NVQLink架构，助力量子处理器与GPU计算深度融合发展

10-29

豆包接入抖音商城开启带货模式：AI与电商融合新探索

10-29

英伟达NVQLink架桥：量子处理器与GPU超级计算机携手开启计算新时代

10-29

从奶茶到啤酒，蜜雪冰城跨界入局，背后藏着怎样的商业新逻辑？

10-29

以虚拟货币为“桥梁”非法买卖外汇超11亿，5人获刑两年至四年

10-29

蓝思科技Q3营收创新高，人形机器人等组装规模居前，具身智能业务前景可期

10-29

英伟达GTC大会重磅来袭，老黄携Vera Rubin登场，算力百倍提升引瞩目

10-29

英伟达BlueField-4 DPU亮相：64核Arm CPU加持，800G网络助力AI工厂效能跃升

10-29

奥特曼：OpenAI拟建发电机制，目标年入数千亿美元或谋上市

10-29

新东方2026财年Q1财报：净营收与利润有升有降，成本开支同步上扬

10-29

圆通速递2025年Q3成绩单：净利润10.46亿增10.97%，前三季度业绩有增有减

10-29

韦伯望远镜捕捉银河系外冰中信号：醋酸等5种生命分子引遐想

10-29

《独行月球》：本为“沈马”而来，却被金刚鼠刚子实力圈粉！

10-29

国网新源江苏句容抽水蓄能电站投产华东地区再添大型“电力调节器”

10-29

点击查看更多 +

全站最新

小米汽车产能飙升：11月中将迎35万辆下线里程碑，**智能电动**赛道加速领跑

小米汽车工厂开放十万人次参观，智造体验赋能工业旅游新发展

小米汽车产能飙升：11月中旬或达成35万辆下线，欧洲市场布局待考

拼多多2025Q2业绩：高增长时代落幕，深水区竞争下短期承压长期待变

2025年三季度杜猛业绩亮眼：摩根新兴动力混合A净值大涨61.91%

智能网联汽车加速演进：2025-2030年网络技术路线图及43页深度报告解析

热门内容

本栏最新

张雪峰多平台社媒账号恢复关注功能，此前曾遇异常状态

义乌全球数贸中心盛大启幕，经营户热情满满开启新市场篇章

王自如“入职”雷鸟创新，AI创业沉寂后回归数码圈引关注

‍小米车主网络攻击援助进展：6032人参与，480人提交证据及援助需求‍

黄仁勋长女Madison首秀直播携手光轮智能共探机器人仿真新路径

智元机器人发布精灵G2人形新品，适配多场景且已揽获数亿元订单

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.