这两天,“豆包手机助手”带着那台只卖给开发者的努比亚 M153,把整个数码圈点着了。官方口径里,它只是一台搭载豆包手机助手技术预览版的工程样机:中兴做硬件,字节负责大模型和系统级能力,售价 3499 元,首批已经被黄牛炒到 7000。
但是,真正让老数码用户起鸡皮疙瘩的是后续的拆包:有开发者把这台“豆包手机”的系统解包后,在代码里清清楚楚地看到了smartisan、smartisanos等字样,甚至还有smartisan tracker appid这样的字段。
另一位博主发现,系统内置铃声里,还留着锤子时代的经典铃声《米店》《被禁忌的游戏》。
于是,“字节手机底层其实是 SmartisanOS 祖传代码”这件事,从玩梗变成了有实锤的技术八卦。
SmartisanOS 没死,只是换了东家如果把时间线拉直,你会发现“豆包手机助手踩在 SmartisanOS 之上”根本不是偶然,而是一个被按下暂停键、多年后又被重新播放的故事。
起点在锤子。
罗永浩曾说过:“锤子的真正核心竞争力不是硬件,而是系统层的设计哲学。”Smartisan 这个名字,本身就是smart + artisan,“智能手机时代的工匠”。在他的设想里,系统应该更温暖、更有秩序、更懂人性,而不是把用户丢在一个遍地弹窗和乱序通知的世界里任其自救。
锤子作为公司死于融资和供应链,梦想太大、算术太小,但作为产品,它留下了一套在中国智能手机史里罕见的系统底层美学。
Big Bang、一步、闪念胶囊,这些看似“炫技”的功能,背后都是对 Android 底层的深度重写——跨 App 的信息编排、悬浮层、剪贴板体系、手势语义化,这些东西今天仍然先进。
2019 年,字节跳动收购锤子科技部分专利使用权,接收了一部分锤子团队;后来这些人进入字节内部的新石实验室、教育硬件团队,先后做过大班课设备、智慧屏等一系列硬件产品。
对外的说法是“用于探索教育硬件”,锤子品牌也并没有在字节手里复活。但有两件事一直没有被真正“关机”:
一是人——原坚果手机负责人吴德周等核心成员,连同大批 OS 与硬件工程师,一起进了字节;
二是系统——SmartisanOS 这个基于 Android 深度定制的操作系统,拥有完整的桌面、通知、输入法、系统服务栈,是少数在交互和审美上都形成过独特气质的国产 OS 之一。
从今天的视角回看,2019 年那次“半收购”,其实是把 SmartisanOS 这套系统、以及围绕它的一整套人才和工程资产,悄悄塞进了字节的代码仓库和组织结构里。只是那几年,大家的注意力都在教育、短视频和 VR 上,很少有人把“锤子”和“未来的 AI 手机系统”画在一张图上。
直到豆包手机助手出现,并被拆包扒出那些 “smartisan” 字样,才让这条历史线变得一目了然。
SmartisanOS 没有作为一个品牌延续下去,但它作为系统底层的“骨骼”,一直睡在字节的硬盘里,等一个让它重新进入 C 端视野的机会。
为什么是 SmartisanOS,而不是从头写一个 OS?从技术上讲,今天的豆包手机仍然是 Android 生态的一员:底层是 Linux 内核 + Android framework,上面跑着第三方 App,豆包手机助手则以系统级服务的形式钩在中间,对各种 UI 事件和系统权限做编排。
那 SmartisanOS 在这里位置是什么?结合公开资料和此次拆包信息,大致可以推演出三层“祖传资产”:
第一层是 UI 与交互框架。SmartisanOS 当年的标志性能力——Big Bang(大爆炸)、One Step(一步)、Idea Pills(闪念胶囊)——本质上都是“跨应用的信息重组和操作编排”。它们需要系统级悬浮层、手势、剪贴板、通知、任务栈等一整套机制配合,而这些支撑 AI 助手“跨 App 代操作”的基础设施,今天依然是刚需。
第二层是系统服务和工具链。无论是弹窗管理、通知分组、任务切换动画,还是状态栏、快捷开关、输入法,都有宝贵的实现细节和大量工程实践。SmartisanOS 多年间在 Android 上做的各种“反人性优化”和小心思,很多其实和今天的大模型时代需求高度契合——比如更精细的剪贴板处理、更可控的前后台切换。
第三层是设备适配与工程体系。做过 ROM 的都知道,真正消耗人力的不是桌面长什么样,而是设备驱动、功耗调优、OTA 体系、安全策略。SmartisanOS 曾经适配过多代坚果手机和一堆高通平台,这些脚本、工具、工程流程,哪怕只保留 30% 的可用性,都比从零开工要划算得多。
对字节来说,复用 SmartisanOS 的代码与工程资产,远比“重写一个从内核到桌面的系统”现实得多。更关键的是,这套系统本身就是为高频人机交互场景量身打造的,当它与大模型结合,本身就有天然的化学反应空间。
豆包想改写的,不只是“语音助手”那一层从豆包手机助手的定位来看,字节显然不是想做一个新版“Siri”,而是把豆包当作“手机上的代理层”。你告诉它一个目标,它去穿梭于各个 App 之间,模拟你的点击和输入,把事情办完。
这套能力,对底层系统提出了几个新要求:
1. 必须有足够细粒度的 UI 语义化能力——知道哪个按钮是“支付”,哪个是“关闭广告弹窗”,哪个是“同意授权”;
2. 必须可以稳定地“接管”输入输出——包括文字输入、语音、触点轨迹、滚动、复制粘贴等;
3. 必须处理好权限与风控——在多 App 间自动操作时,什么能做,什么不能做,出了问题谁背锅。
某种意义上,豆包手机助手走的是一条“系统级 RPA + 大模型 + 视觉理解”的路,这需要一个足够开放、可深度改造的 Android 分支作为地基。
SmartisanOS 最大的价值,恰好在这里。
当年它为了做“一步”“大爆炸”这些看起来“很不 Android” 的交互,把系统层能动的地方几乎摸了个遍。如今字节要在手机上搭建一个“AI 代操作层”,最省事的方式,就是在这套已经被改造过一次的框架上,再往上叠一层大模型和视觉理解能力。
从这个视角看,“豆包手机底层是锤子祖传 SmartisanOS”的技术传承,就不仅仅是情怀了,而是非常现实的工程与产品选择。
情怀、风险与新的权力博弈对老锤粉来说,这几天最“上头”的不是豆包能不能操作微信,而是久违的那股“锤味”又回来了:图标的克制、字体的质感、甚至那段在发布会响过无数次的《米店》铃声,都在某个瞬间把过去的情绪狠狠拉了回来。
SmartisanOS 的设计语言本身就是一种稀缺资产,在如今高度同质化的 UI 世界里,一套能被一眼认出的视觉体系,是所有手机厂商梦寐以求的差异化。
但情怀的温度越高,现实的冷水泼得就越快。
豆包手机助手凭借模拟点击跨 App 操作的能力,很快让微信的安全系统亮起红灯:用户反馈登录被强制下线,多次尝试仍无法进入账号。舆论的第二轮冲击很快到来。豆包助手在努比亚设备上使用了 INJECT_EVENTS 这一系统级权限,引发部分科技公司公开质疑。
豆包随后发布了一篇长文澄清,承认该权限的确是系统级能力,但强调每次调用都必须经过用户主动授权,权限用途也都在清单中透明披露;更明确指出,目前业内所有能够操作手机的 AI 助手,本质上都依赖同类系统级能力,否则根本无法实现相关功能。
字节试图把“安全边界”讲明白:手机助手不会在云端存储任何屏幕内容;所有操作过程不会进入模型训练;长任务执行时屏幕会持续提示,用户可随时中断;一旦遇到支付、验证等敏感环节,任务会立刻暂停,用户必须手动接管。用一句更直白的话说,他们的目标不是“帮你操作一切”,而是“在你看得见、可控制的前提下,代你执行可代行的部分”。
所以豆包不断强调“技术预览版”的身份,并选择小批量、非面向普通消费者的方式发布,就是在提醒所有人:这是一场技术探索,而不是成熟产品落地。规则还没写完、行业还没达成共识,但必须先把原型放出来,让行业看到下一代系统级能力的雏形。
情怀是好的,风险是现实的,而系统级权力,则是更深的、也是更难的那道题。锤子当年没答出来,今天轮到字节拿着大模型、拿着跨应用能力,再试一次。而这道题的答案,可能会重新定义未来十年的“手机操作系统”。
从 SmartisanOS,到“豆包 OS”?
把线拉长一点,你会发现一条挺耐人寻味的演化路径:
SmartisanOS 时代,人们讨论的是“手机系统是不是应该更有人性、更好看”;到豆包手机助手时代,问题变成了“手机系统是不是应该变成一个可以理解自然语言、自动帮你操作的代理”。
前者强调的是界面与交互,后者强调的是意图与编排。
而那套写在 SmartisanOS 里的底层逻辑——如何跨 App 处理文本、如何在不同窗口间快速拖拽、如何用一个全局浮层承载复杂操作——其实早就为今天的大模型时代埋下了伏笔。
接下来几年,很可能会出现这样的局面:
对普通用户来说,“豆包手机”只是更聪明的 AI 助手 + 一点锤味 UI;
对行业观察者来说,它是一次 OS 权力结构重组的预演——大模型厂商第一次试图跨过传统 OS 厂商,直接在手机系统层插一只脚;
对锤粉来说,这是 SmartisanOS 的一次“曲线回归”:品牌消失了,但它的代码和设计理念,被嵌入了一代新型 AI 系统的骨架里。
这也是为什么,“字节手机底层其实是锤子手机 SmartisanOS 祖传代码”这件事,会在技术圈之外引发这么多讨论——它不仅是一个拆包彩蛋,更是一条清晰的时间线。
从罗永浩在发布会上讲 Big Bang,到字节用豆包手机助手演示跨 App 自动下单、抢票、刷题,这中间隔着六七年、几轮行业周期,但很多关键的工程积累,其实在同一份代码仓库里悄悄延续。








