在人工智能技术飞速发展的当下,数据已成为驱动行业变革的核心资源。上海库帕思科技有限公司作为国内首家专注于AI语料数据服务的企业,正以创新技术破解行业数据瓶颈,为人工智能发展注入新动能。这家成立仅两年的企业,凭借其独特的战略布局和技术优势,迅速在AI数据领域占据领先地位。
公司首席技术官王长冕指出,当前大模型竞争已从算法优化转向数据质量比拼。传统互联网数据经过多年开发利用,已难以满足新一代AI模型的需求。特别是具身智能、多模态模型等前沿领域,对"AI专用数据"的需求呈现爆发式增长。这类数据需要经过特殊处理,才能实现高效训练和精准推理。
面对行业痛点,库帕思构建了覆盖数据全生命周期的解决方案。通过"语料魔方"技术体系,公司实现了数据采集、清洗、标注、合成的全流程重构。在基础设施层面,以AI Ready为导向打造专业化处理平台,确保数据质量符合模型训练要求。更关键的是,公司通过供需闭环机制,正在重塑整个语料行业生态。
技术突破带来显著成效。2025年下半年,库帕思连续取得"具身智能数据合成与标注方法"等专利授权。与智元机器人的合作中,公司完成数千万级真机数据采集和仿真数据合成,为机器人智能体发展提供关键支撑。在医疗领域,公司中标临床人工智能语料集项目,通过专业处理使肠胃镜模型训练效果获得突破性提升。
上海独特的产业环境为库帕思发展提供沃土。作为国有控股企业,公司承担部分公共数据运营职能,获得珍贵的数据资源和项目机会。城市活跃的创新创业生态,特别是大量涌现的微型科技企业,成为公司重要的服务对象。这种产学研用深度融合的模式,正在形成良性循环。
2026年初,库帕思启动"模塑申城语料普惠计划2.0",宣布向中小企业、科研机构免费开放高质量语料服务。该计划设定明确目标:到2027年底将连接500个创新主体,打造300个专业数据集,提供价值超1.5亿元的数据服务。这项举措被视为推动上海AI产业生态升级的重要举措。
在王长冕看来,无论AI模型如何迭代,对高质量数据的需求将持续增长。库帕思正以全流程覆盖、多模态处理、智能化为核心战略,持续完善人工智能数据基础设施。通过提升数据处理自动化水平,公司致力于增强上海在AI数据要素领域的全球竞争力,为构建具有国际影响力的人工智能产业生态提供基础支撑。







