4月29日消息,2006年的Pi Day(3月14日,圆周率日),一个起初看似简单的“弹性存储”概念被推向市场,它允许开发者以极低的成本存储无限量的数据。20年后的今天,这个名为Amazon S3(Amazon Simple Storage Service)的服务不仅承载了超过500万亿个对象,更在AI爆发的时代,悄然完成了从一个“被动数据湖”向“主动智能基础设施”的蜕变。
在20周年之际,我们与亚马逊云科技技术副总裁Mai-Lan Tomsen Bukovec进行了一场深度对话。访谈刚一开始,她就难掩兴奋地分享了一个刚刚收到的喜讯:Amazon S3 Vectors在2026年NAB Show(全美广播电视展)上荣获了“年度产品奖”。
亚马逊云科技技术副总裁Mai-Lan Tomsen Bukovec
谈及Amazon S3一路以来的创新发展,Mai-Lan总结道:“对每一个Byte(字节)的承诺,无论那是非结构化数据、Parquet文件,还是一个向量字节,这是我们过去20年从未改变的准则,也是未来20年不会改变的准则。”
S3 Tables打破“只读”:Iceberg与数据表的可编辑革命
回顾Amazon S3的演进,Mai-Lan认为其产品定义是“弹性”的,这种弹性不仅在于容量,更在于产品形态。最初的S3是一个巨大的非结构化数据仓库,如果用户想修改视频或音频文件中的一部分,必须替换整个对象。
然而,S3 Tables的推出彻底打破了这一边界。通过原生支持Apache Iceberg格式,Amazon S3中的数据第一次变得“可编辑”。
“这是一个巨大的飞跃,意味着你可以用S3的价格优势直接操作数据表,”Mai-Lan解释道。最令人兴奋的并非仅是存储本身的变革,而是由此催生的生态化学反应。她观察到,从Supabase的Postgres到Oracle的GoldenGate,数据库的变更数据正被直接呈现在S3 Tables中。
这种变化在AI时代尤为关键。Mai-Lan指出,AI Agent极度依赖SQL和Iceberg格式。因为大语言模型(LLMs)在训练时就已经对SQL和结构化数据逻辑非常熟悉,将数据以Iceberg形式存放在S3中,等于为数以万计的AI Agent扫清了数据访问的障碍,让Agent不必再去费力学习复杂的API调用。
S3 Vectors和S3 Files构建共享记忆:向量成为一种新语言
如果说Iceberg解决了Agent“读懂数据”的问题,那么S3 Vectors则解决了Agent“记住状态”的问题。
在2026 NAB Show颁奖典礼上的高光时刻并非偶然。Mai-Lan透露,自S3 Vectors发布以来的五个月里,市场需求经历了显著的增长。起初,团队预期的主要用例是通过嵌入模型为数据添加上下文,用于RAG或语义搜索。但实际增长的爆发点在于Agent系统的共享记忆。
“LLMs在记忆能力上的飞跃非常显著。无论是Agent之间、人机之间还是Agent与数据之间,都在引入更深层次的对话上下文。而向量,就像是为AI交互体验注入的‘状态’。”Mai-Lan将S3 Files和S3 Vectors的组合形容为Agent的“共享记忆空间”。
随着S3 Files的发布,这种交互变得更加自然。S3 Files在物理存储上是对象,但在逻辑接口上是符合POSIX标准的文件系统。
Mai-Lan还分享了一个非常细腻的产品洞见,她认为:“由于LLMs在训练中接触了大量的Python库和Shell脚本,AI Agent天生就习惯将文件作为数据接口。”这种底层逻辑的契合,使得开发者无需重构代码,就能让AI直接通过文件目录与海量数据交互。
延迟与成本的经济学权衡
尽管AI追求极致的低延迟,但Mai-Lan坦率地承认,S3的架构延迟确实高于数据库。向量数据库能在几毫秒内完成查询,而S3 Vectors大约需要100毫秒。然而,她认为这并非缺陷,而是一种设计上的权衡。
“并非所有的AI应用都追求亚毫秒级响应。很多科研分析、大范围的产品相似度搜索,甚至生成报告的Agent,完全可以在100毫秒的延迟下运行得极其完美。”她类比道,就像2006年时,人们虽然会为极致性能选择数据库,但绝大多数工作负载依然会流向更具成本效益的S3。
进入Agent时代,这种成本考量变得更加残酷且现实。Mai-Lan指出,人类工程师通常一次只跑一个查询,而AI Agent为了寻找最佳路径,往往会瞬时发起数十甚至数百个并行查询,是极其激进的数据消费者。在这种情况下,底层存储和分析服务的成本效率,可能直接决定了一个Agent应用能否盈利。这种肉眼可见的大规模消耗,让S3的性价比优势在AI时代反而成了一种护城河。
跨越20年的工程承诺:数学般的严谨
在长达20年的服务中,S3最令Mai-Lan感慨的并非某个新功能,而是一次对底层的重构,即引入“强一致性”。
这种“对每一个字节负责”的执着,体现在S3底层的300个微服务中,其中大量服务每天都在默默充当“审计员”的角色,反复校验数据完整性。正是这种极致的工程追求,才构筑了S3标志性的11个9持久性。
“产品形态的演进必须是连贯的,新能力必须与原有服务逻辑完美契合。”Mai-Lan强调,“S3 Vector将持久性原则贯彻到向量中,S3 Tables让表格的操作感与原有数据类型保持一致,让表格数据像存储桶一样,可以轻松同步。这种在扩展边界的同时保持内核连贯性的思路,是我们过去20年、乃至未来20年进化的核心逻辑”
访谈接近尾声时,Mai-Lan提到了亚马逊的一句领导力准则——“Are Right, A Lot”决策正确。要做到这一点的关键是:领导者要不断证伪自己的信念,即不断推翻“我们构建的一切都运行良好”这种念头。在AI技术每隔几个月就颠覆一次认知的2026年,Amazon S3的这条成功经验反而显得格外清醒,这种时刻寻找改进现有系统或构建新能力机会的执着,可能才是其成为AI时代兼具数据韧性与技术创新能力的标杆的底层逻辑,同时能够敏锐响应每一次技术浪潮变化背后潜藏的真实客户需求。










