在2025年的科技浪潮中,全球迎来了生成式AI的新高潮,其中DeepSeek和OpenAI推出的GPT-4.5成为了引领这一趋势的两大开源AI模型。在这场技术革命中,数据作为AI发展的三大支柱之一,其重要性愈发凸显,被视为数字时代的新型核心生产要素。
据IDC统计数据显示,2024年全球大数据IT总投资规模已接近3540亿美元,预计到2028年,这一数字将跃升至近6440亿美元,五年复合增长率高达16.8%。特别值得注意的是,中国在这一领域的发展尤为迅猛,预计2028年中国大数据IT支出将达到621.7亿美元,占全球比重约10%,复合增长率更是高达24.9%,位居全球首位。而目前,中国的数据产量已占全球数据总产量的23%。
面对这一趋势,OceanBase首席技术官(CTO)杨传辉在接受钛媒体AGI专访时表示,AI时代的到来,不仅推动了数据处理边界的延伸,还加剧了数据扩展性、数据规模以及数据碎片化等行业挑战。杨传辉透露,OceanBase正致力于构建一体化数据处理平台,以应对这些挑战,并满足客户需求。
作为国内领先的一体化分布式数据库公司,OceanBase自2010年成立以来,便凭借其在金融、政务、运营商、零售、互联网等多个行业的深厚积累,助力超过2000家客户实现了关键业务系统的升级。2020年,蚂蚁集团旗下的OceanBase成立了北京奥星贝斯科技有限公司,并开始了商业化运作,相继推出了OceanBase4.0、4.2、4.3等多个版本的技术产品和解决方案。
2025年4月,OceanBase CEO杨冰在一封全员信中宣布,公司将全面进入AI时代,致力于打造“DATA×AI”核心能力,并建设AI时代的一体化数据底座。蚂蚁集团也将向OceanBase开放全部AI场景,以支持这一战略的实施。为确保战略顺利推进,OceanBase启动了人才和组织体系的升级,任命CTO杨传辉为AI战略负责人,并成立了AI平台与应用部、AI引擎组等新部门。
在即将于5月17日举办的2025开发者大会上,OceanBase将以AI为主题,展示其在AI领域的最新成果。杨传辉在被任命为AI战略负责人后的首次公开对话中强调,打造“AI时代的一体化数据底座”是OceanBase现有战略的自然延伸,这既源于市场需求,也基于OceanBase已具备的产品技术能力。
杨传辉指出,AI时代下,数据规模和数据种类的复杂性不断增加,数据库与AI的关系已不再是简单的DATA+AI,而是DATA×AI。这背后需要的是处理海量数据和不同结构数据的能力,以及将数据与模型融合的工程能力。OceanBase作为一体化分布式数据库平台,具备分布式和一体化的产品特色,将成为AI时代下的最佳选择。
然而,要实现这一目标,OceanBase仍面临诸多挑战,包括技术创新和生态建设等。杨传辉表示,OceanBase需要不断把握策略定力,以时间和坚持来确保公司的未来发展。他坚信,AI时代的一体化数据底座一定能够满足用户需求。
在专访中,杨传辉还详细阐述了OceanBase在AI战略上的思考。他提到,OceanBase对数据库与AI的关系进行了深入思考,认为两者应有更融合的化学反应。大模型在技术层面主要分为算法能力、工程能力、数据能力和应用能力,而数据库的研发团队天然具备工程能力,这能够帮助DATA与AI技术进一步融合,实现DATA×AI。
针对当前生成式AI技术面临的数据量通货膨胀、数据孤岛碎片化严重、数据分析需求爆发等挑战,OceanBase在4.3和即将发布的4.4版本中,加强了扩展性和工程能力,以更好地处理无结构化数据,并进一步加强向量能力。
在即将召开的开发者大会上,OceanBase将发布一系列与AI相关的数据库产品和能力,包括在向量数据库等一体化数据底座的数据处理能力上的显著提升。同时,OceanBase还将发布RAG服务,帮助企业通过一体化将自有数据和公开数据模型相结合,获得更大的业务价值。OceanBase还将展示其应用大模型取得的最新成果。