在端侧AI算力领域,过去大半年间,各类产品层出不穷。从英伟达DGX Spark到各厂商的桌面AI超算,人们不断进行着模型推理测试、ComfyUI工作流尝试以及各类AIGC场景的探索。这些产品虽各有亮点,但一个事实逐渐清晰:端侧硬件虽强,却并非适合所有人在所有阶段直接购置。
以入门级AI开发者为例,初期可能仅需运行7B参数的小模型,但几个月后或许就想尝试70B甚至更大规模的模型。这是由于算力需求呈逐级上升态势,若一步到位购买顶配硬件,前期利用率极低,毕竟此时开发者尚处于入门阶段;若先购买够用配置,过不了多久又会面临升级问题,因为此时已具备一定水平。这种节奏很难精准把握。
如今,一个人借助AI工具承担传统小团队工作的“OPC(One Person Company)”概念逐渐兴起,成为超级个体的愿景听起来十分美好,但对算力的要求也大幅提升。一个人可能上午是AI开发者,忙着调试模型、编写代码;下午变身内容创作者,制作AI漫剧;晚上还想玩玩游戏放松身心。不同角色对算力的需求差异巨大,一台固定配置的机器很难满足所有场景的需求。
Gartner曾预测,在未来5到10年内,DaaS(桌面即服务)将成为主流,云电脑有望成为企业与组织的首选办公计算机。其背后的逻辑在于,当摩尔定律的边际效应递减,而AI模型参数量却以摩尔定律数倍的速度增长时,算力向云端迁移成为必然趋势。这也是我们开始关注云端桌面AI的原因。
近期,我们体验了一款名为阿里云无影个人云超算的产品。准确地说,是在线上“开通”了一台云端电脑,经过一周的体验,有了诸多新发现。
阿里云无影是一款可随时随地接入的云上电脑,其最大特点是实现了“算力与终端的彻底解耦”,为用户带来了极大的便利。在实际体验中,无论使用MacBook、Windows笔电还是iPad,只要安装无影客户端App,就能瞬间接入同一个云端桌面。
2020年,阿里云推出第一代无影云电脑,其终端是一个名片夹大小的C - Key,连接显示屏即可进入云端桌面。当时这一品类还需反复解释,很多人将其与远程桌面混为一谈。到了2024年,无影个人版亮相,个人玩家可直接运行《黑神话:悟空》,在1080P分辨率下帧率稳定在60帧。到CES2026,桌面AI超算成为几乎所有PC厂商的标配,惠普将AI PC集成到键盘里,联想让笔记本屏幕自动旋转跟踪人脸,众多厂商基于DGX Spark推出巴掌大的本地AI超算。而连续两年参展的阿里云,作为云厂商拿出了无影个人云超算。
无影个人云超算有一个终端硬件“无影魔方ultra”,它巴掌大小,比一本精装书还轻,类似接口丰富的“瘦客户机”,可轻松塞进口袋。别看它尺寸小巧,背后连接的云端配置却十分强大:两块RTX 5880(单卡48GB显存,Ada Lovelace架构专业级显卡)、64核vCPU,总共96GB GPU显存。96GB显存意味着什么?市面上顶级的消费级显卡RTX 5090显存仅32G,96GB是其三倍,可轻松加载100B以上参数大模型进行推理,运行视频生成任务也不在话下,无需担心爆显存问题。在本地搭建这样一套硬件环境,成本至少三万元以上,而在无影上,前期巨大投入被化解,它如同列表里的一个图标,可随时支配,让超级算力变得触手可及。
“无影魔方ultra”本身不进行计算,所有算力都在云端,可看作一个“无限算力的水龙头”:插上电源、连上屏幕,就能打开云端那台超级电脑,获取源源不断的高性能。此次体验开通的是双卡配置,顶配还可选择4块RTX 5880(合计192GB GPU显存)、96核服务器级CPU、384GB内存,这样的性能参数在多数场景下都应能满足需求。
传统个人电脑是一次性购买,而无影的算力具有弹性。今天运行轻量任务可使用小规格配置,明天进行模型训练可一键切换到顶配,数据通过无影存储中心无缝同步,切换过程不会丢失进度。打开后台,通过“镜像管理”,可为“云电脑”“AI学习机”“工作站”一键镜像多个系统,此次主要镜像了Windows、LinuxUbuntu、Kylin三种不同系统进行测试。
左侧列表中的“无影内容广场”如同一个“AI超市”,这里有大量第三方共享镜像。想做图,可选择“ComfyUI - 含主流模型和节点”镜像;想进行模型训练,可选择“AI - Toolkit LoRA训练”镜像;想运行模型推理或搞开发,PyTorch、TensorFlow基础框架一应俱全。甚至还有ModelScope(魔搭社区)、DiffSynth - Studio等阿里达摩院的独家生态镜像。
参数只是参考,实战才是关键。此次评测直接采用高强度测试,用目前AI圈最主流且消耗显存的ComfyUI视频生成工作流进行极限压测,运行阿里开源的Wan 2.2 14B(万相)视频生成模型。设定提示词为“马在行走,丝带飘动,表情灵动(A horse walking, ribbons flowing, vivid expression)”,分辨率设定为1280×720,开启FP8矩阵乘法优化和FLOW流匹配架构,后台日志开始快速滚动。
在模型加载阶段,即便使用了FP8量化优化,仅模型权重就占用了13629MB,将近13.6G显存。若加上推理过程中的中间变量(KV Cache),24G显存的本地显卡不仅难以应对,甚至会直接爆显存。而在无影上,日志显示当前可用显存28969MB,对于96G的总显存而言,毫无压力。生成速度方面,核心采样过程耗时1分20秒,从点击开始到视频生成完毕,总耗时3分34秒。日志中还有一行“lowvram patches: 357”,这是针对低显存环境的自动优化补丁,对96G显存来说虽有些多余,但也体现了无影在软件层面兼容性做得细致。
至顶AI实验室的小伙伴实测后表示,无影使用起来又快又方便,可直接将ComfyUI配置到电脑的Chrome浏览器上使用,相当于在浏览器上直接运行ComfyUI。更值得一提的是,镜像市场里预配好的ComfyUI环境,两卡96G显存可同时加载多个大模型和LoRA权重,无需反复卸载和重装。对于AI漫剧创作者来说,一条漫剧工作流往往需要串联多个模型,在24G显存的本地显卡上,模型切换需反复腾挪,而96G显存可让所有模型常驻,创作者可专心调参,提高产能,让高端生产力工具变得平易近人。
工作之余,这台“怪兽”能否用于放松呢?切换到云电脑模式,无影的内容广场里预置了《黑神话:悟空》《鸣潮》《我的世界》《永劫无间》等15款热门游戏大作,未来可能还会上线更多游戏。进入某款游戏并登陆相关账号后,还可通过账号入口登陆更多游戏。
时延是云游戏的关键指标之一。官方建议,要获得1080p、30fps的流畅基础体验,需保证15Mbps以上的带宽,网络延迟低于60ms;若追求1080p、60fps的电竞级高帧率丝滑体验,带宽门槛需提升至25Mbps,延迟可达到30ms以内。此次实测,玩《鸣潮》这类动作游戏时操作跟手度极高,延迟基本稳定在16ms上下,几乎感觉不到是在云端运行。在《我的世界》这类对加载速度要求较高的游戏中,大部分时间也非常流畅,仅在极少数复杂场景下,时延会短暂波动到60ms左右,但不影响操作。
前面一直使用无影客户端进行测试,实际上“无影魔方ultra”支持多端接入。即便只携带“无影魔方ultra”,任何一块屏幕都能成为接入入口。在游戏场景中,这一特性十分有趣:在办公室可用MacBook玩,回家路上可用iPad接着玩,存档和进度无缝衔接。这表明,当算力在云端且延迟足够低时,手中设备的品牌和配置已不再重要,屏幕成为关键。
使用Mac客户端接入时,有个细节令人印象深刻:本地Mac和云端无影之间可直接拖拽文件,操作感觉就像在同一台电脑的两个文件夹之间移动文件,使用过程中会产生一种错觉,仿佛MacBook突然多出了几块RTX 5880显卡。
对于超级个体而言,一天的生活可能是这样的:上午用容器模式调试模型、编写代码,下午切换到Windows环境进行AIGC内容创作,晚上打开云游戏放松身心。一台固定配置的物理主机很难满足这些不同角色的需求,但在无影上,切换身份就像切换频道一样简单。这也意味着,超级算力不再是少数专业人士或机构的专属,而是成为陪伴用户从好奇、探索到精通的成长伙伴。
性能之外,成本也是用户关注的重点。无影的核心优势之一是将一次性高昂的硬件投资转化为极致可控的按需付费服务,采用“核时”计费模式。根据实测后台数据,“开机”状态下,无论是云电脑还是容器,平均消耗150.82核时/小时;“关机”状态下,云电脑消耗0.06核时/小时,容器消耗0.04核时/小时。若不手动点击“关机”,后台会持续运行,因为系统默认用户可能在后台运行长任务(如训练模型),此时处于7×24小时工作状态,这也是为了保障用户花几周配置好的环境不会因关机而清空,这些核时换来的是数据安全存储和下一次启动的便利。即便手动点击“关机”,后台仍会消耗极低的存储费,因为用户的数据(硬盘、镜像、环境配置)仍占用云端资源。不过,关机状态下24小时消耗的核时总共仅几毛钱,若确定不用,点击“销毁”即可。具体费用方面,根据阿里云官方说法,即便是4卡RTX 5880顶配(192GB显存),每月按量付费也仅在1000元左右。此次体验的双卡配置,每天高强度使用8小时,其余时间关机,月费大约500 - 600元。作为对比,CES上同台亮相的DGX Spark,搭载GB10 Grace Blackwell超级芯片和128GB统一内存,单台售价3999美元起步。但两者设计思路不同,DGX Spark走本地化路线,一次买断,性能固定,胜在离线可用、数据不出本机;无影走云端弹性路线,按需取用,随时升降,胜在配置天花板高、无硬件折旧。在一些公开测评中,无影顶配的综合跑分可达DGX Spark的数倍,而月费远低于后者的一次性购入成本,当然,两款产品面向的场景和取舍不同,直接比价未必公平。
若只是将传统PC的算力搬到云上,无影只能算是“更方便的高性能电脑”,但无影的另一个拳头产品AgentBay,展现了更大的野心。AgentBay是无影为AI Agent(智能体)打造的云端基础设施,它让AI助手获得了“手和脚”,AI不再只是坐在聊天框里回答问题,而是可以在云端沙箱里操作浏览器、控制桌面应用、执行代码、操控手机界面,所有操作都在安全隔离的环境中独立运行,不影响用户自己的设备。想象一个场景,对AI说“帮我从这五个PDF里提取关键数据,整理成Excel,然后发邮件给团队”,过去AI只能写出提取脚本,剩下的需用户自己动手,有了AgentBay,AI可在云端打开一台完整的电脑,自行操作浏览器下载文件、打开Office处理数据、登录邮箱发送,全程无需用户介入。这与最近爆火的clawdbot类似,不过Agentbay增加了内置Clawdbot模式,同时还具备browser use能力和企业多Clawdbot部署能力。
此次上手体验,最让人印象深刻的不是某个具体的跑分数字或启动速度,而是一种错位感。手中握着一个比充电宝大不了多少的小方盒,屏幕上却运行着需要服务器机房才能驱动的大模型。没有风扇的呼啸声,没有机箱的发热,连多余的线都不需要。好的计算或许就像好的设计,当用户不再需要思考显卡是否够用、内存是否充足、驱动是否安装时,就可以将全部注意力放回真正想做的事情上。












