AI 的时代,时间真的过得飞快——
指挥大语言模型编程的「vibe coding」仿佛就兴起于昨天,实际上它被《柯林斯英语词典》评为年度词汇都过去半年多了。
图|Cycode
只是在 AI 遍地之后,「用 AI 写程序」逐渐不是那么让人兴奋了,和养龙虾一起变成了那些「AI 极客」们日常生活的一部分。
但在今年的 Google I/O 和 WWDC 上,我们却看到了 vibe coding 的强势回归:
图|YouTube @Android Developers
其中,谷歌通过 Google AI Studio 与 Gemini Spark,赋予了用户编写交互式网页、手机小组件(widget)和 Android 应用的能力。
一向不喜欢 vibe coding 的苹果,也在 iOS 27 中新增了用自然语言指挥 Siri AI 编写捷径以及 Safari 拓展的功能。
图|YouTube @Apple Developers
也就是说,如今能用 AI 创作程序的,终于不再是各路 KOL 或者 AI 大拿,而是拿着手机的每一个人。
立项到落地只用 20 分钟
没想到的是,我最先用上的 AI 开发工具不是 Cursor 也不是 Codex,而是被戏称为「美国豆包」的 Gemini 3.5 Flash。
在 vibe coding 领域,谷歌有一项 Anthropic 和 OpenAI 都难以匹敌的资源—— Android 生态。
图|Google Blog
这也是用 Gemini 做 vibe coding 的最大优势:
以往用 Codex 或者 Cursor 做 Android 开发,它们真就只输出代码,很难做到「开箱即用」。
开发者要么只能在模拟器里测试,要么就得手动打包才能在自己的手机上安装,「生产端到应用端」的阻力很大。
基于 Kotlin 框架和最新 Android SDK
在新版本的 Google AI Studio 中,谷歌「一步到位」地解决了这个问题。
它做好了 Gemini 和 Android Studio 之间的对接,让用户可以从网页直接安装 app 到手机上,从开发到路测只用几秒钟:
这样一来,vibe coding 就从原本「折腾代码」变成了一项谁都可以试试的活动。
毕竟当乙方很难、当个随便给 AI 上压力的甲方总没有门槛了吧?
也是在这种背景下,小编作为只有初中 Visual Basic、大学 Python 基础的「纯小白」,用 Google AI Studio 写出了人生中的第一个 app。
这款名为 Cocktail Shaker(鸡尾摇摇摇)的 app 负责解决一个很简单的问题:
在酒吧不知道喝什么的时候,拿出手机摇一摇,它就会随机从 90 多种经典鸡尾酒里面推荐一款,适合所有选择困难症用户。
而从产生创意、选择风格、Google AI Studio 完成基础代码到输出第一版 app,只花了不到二十分钟。
从接收指令到输出第一个版本耗时 856 秒
之后我又通过口语聊天的方式,给 Gemini 反馈了一些 UI 需求和 bug,逐步添加了动态布局、震动反馈、DIY 鸡尾酒单之类的功能:
在两天总计约 8 个小时的「开发」之后,我就得到了一个适配最新 API、符合 Material 设计规范、支持不同 DPI、手动和批量导入鸡尾酒配方,甚至拥有一个彩蛋的选酒 app ——
在这期间我唯一需要做的,就是描述清楚发现的 bug 和下一步需求,以及反复把手机插到电脑上安装下一个版本。
0.1 基础开发
但如果你看到了上面的结果很兴奋,也想要尝试一下的话,现阶段的阻力还是不少的。
首先还是那个老生常谈的问题:
这些 AI 工具本身都有一定的使用门槛,不能像豆包那样下个 app 就开弄。
无论是 99 美元/月(约合人民币 680 元)的 Google AI Ultra 订阅费,还是访问 Google AI Studio 网站,这些「前期成本」对于普通用户来说,还是比较高的。
虽然「用 Gemini 写安卓 app」听起来很轻松,但它终究涉及到一些编程知识,不是完全的「0 门槛」。
比如在早期版本中,Cocktail Shaker 出现了横屏时手机状态栏和导航条与 app 界面重叠的问题,状态栏会挡住鸡尾酒卡片。
如果你只说「我的 app 转过来的时候显示不对,修好它」,Gemini 会花很多时间查找问题并重写横屏界面,排障效率并不高。
如果你知道一些基础的 Android 开发术语,更精确地告诉 Gemini:
app 在横屏(landscape)的时候状态栏(Status Bar)和手势条(Gesture Handle)不会自动隐藏,修好它。
AI 就能很快解决这个问题,并且知道不要修改横屏界面的其他 UI 布局:
如果你想在手机上测试刚刚开发的 app,也要知道怎么打开「开发者选项」和「ADB 调试」,然后才能从网页端安装:
除了对使用者有一些技术知识的要求之外,Google AI Studio 写 app 还有另一个问题:美工不太行。
这倒不是说它 vibe 出来的 UI 不好看。
在首次接收到要求之后,Gemini 会生成几个不同风格的预览让你选择,后期调整空间也很高:
然而 Gemini 在设计 app 图标的时候,它似乎只会调用 Banana 生图,无法编写 Android 设计规范中的自适应图标(Adaptive Icon)。
比如我的提示词非常清晰:app 图标是一片青柠(a lime slice),但 Gemini 显然有着自己的理解:
在上述这些小问题之外,在 Google AI Studio 中指挥 Gemini 3.5 Flash 在线开发 Android 程序的体验已经相当顺畅了。
用 AI 创造一个 100% 解决自己问题的 app,还不用担心图标上有牛皮癣、app 里面有广告和乱偷权限,这才是 AI 赋予普罗大众的「平权运动」。
未来,人人皆可 coding
整体来说,Gemini 3.5 Flash 在开发领域的「小试牛刀」效果还是很不错的。
它的强项除了 Flash 模型本身的速度之外,和各种谷歌服务的联动,以及天生对 Android 开发规范的良好支持都是不能忽视的。
最重要的是,它实现了 vibe coding「从编辑器到手机」的无缝直装。
用户第一时间就能用上自己的成果,这是目前 Claude Code、Codex 和其他 AI 开发工具都很难做到的体验。
同时我们也看到,除了谷歌和苹果之外,连微信正在内测的 AI 助手「小微」都支持了一个类似 vibe coding 的「开发自己的小程序」功能:
这三个十亿用户级别的品牌/产品,开始不约而同地押宝「类 vibe coding 能力」,这绝非偶然。
正如爱范儿在之前的文章中提到:
在未来 AI 重构 GUI(图形交互界面)的逻辑之后,「千人千面、符合每个人需求」的小组件或许会取代 app,成为用户获取信息的主要途径,有点像曾经的 Windows Phone。
而来自系统底层的、自带的 vibe coding 能力,正是让小组件能够符合每个人需求的技术基础。
某种意义上,这样的智能交互方式,又回到了「个人计算机」最原初的状态:用户打开计算机,直接进入 BASIC 编程界面,自己按照需求和写程序、做脚本。
更进一步看——未来应用程序、小组件以及 PWA(网页程序)之间的界限,在 AI 和 vibe coding 的影响下会进一步模糊。
当 vibe coding「让每个人都拥有自己的生产工具」之后,这对于打破一些巨型软件厂商的绝对垄断地位,从长远角度说是相当有意义的。






