ITBear旗下自媒体矩阵:

对话丘脑智能:AI记忆融合时间维度,主动智能时代或将来临

   时间:2026-02-03 10:35:57 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在人工智能技术飞速发展的当下,一个显著的现象是:尽管AI已经展现出强大的能力,但它仍然无法真正“认识”用户。它无法感知用户昨天经历了什么,不了解用户处于人生的哪个阶段,也无法察觉今天的用户与一个月前有何不同。这种局限性使得AI只能被动等待用户发起询问,然后尽力给出一个看似“正确”的回应,这种模式被业内称为“被动智能”。

为了突破这一局限,众多科技公司开始探索“记忆”功能。模型公司希望通过记忆功能让回答更具个性化,应用层则期望通过记忆赋予AI温度,使对话更加连贯。然而,这些尝试大多停留在为特定场景服务的层面,目的是让AI更好地即时“响应”用户,而非真正“理解”用户。

丘脑智能则选择了一条不同的道路。该公司致力于将记忆打造成为一种基础设施,通过理解用户的身份、变化以及潜在需求,实现AI与用户之间更深层次的连接。这一目标将分两步实现。

第一步是构建完整的记忆体系。当前大多数记忆方案仅能处理文本信息,但人类的生活轨迹包含照片、语音、视频等多种数据痕迹,且这些信息具有时间顺序。丘脑智能的首要任务是解决“时序性”和“全模态”问题,使AI能够理解用户生活中所有类型的信息,并明确它们在时间轴上的位置。为此,该公司基于自研的时空知识图谱框架(STKG),在多项长程记忆评测中取得了突破性进展。在针对Agent长期对话记忆的权威榜单LoCoMo测试中,其核心产品OmniMemory在保证P95检索延迟低于2秒的前提下,综合准确率达到82.5%,跻身全球AI记忆方案的第一梯队,并于近期开始内测。

第二步是实现从被动响应到主动智能的跃迁。当AI拥有完整且具有时间感的记忆时,它将能够主动预判用户的需求。这一逻辑基于一个观察:人类的行为具有连续性,今天的状态是昨天的延续,明天的需求往往隐藏在今天的变化中。如果AI能够捕捉到这种轨迹,就能推断用户接下来可能需要什么。这种能力将使人机交互模式发生根本性变革,从“人找信息”转变为“信息找人”,最终实现“AI懂人”。

丘脑智能的CEO张源和CTO赵翔在对话中分享了他们对记忆、时间以及AI与人类关系的思考。张源表示,他与赵翔于2023年初相识,当时OpenAI的模型引发了行业震动,两人均认为未来十年将是AI的黄金发展期。尽管当时国内基础模型尚需迭代,但他们决定各自积累经验——赵翔在浙大从事相关研究,张源则加入一家自动驾驶域控公司担任COO。到2025年初,随着DeepSeek等模型的成熟,他们认为创业时机已到。作为高频AI用户,张源深刻体会到记忆孤岛问题:在不同平台上输入大量提示词后,更换模型时需重复输入偏好设置,这一痛点促使他们决定自行解决记忆问题。

赵翔介绍了OmniMemory 1.0的技术特点。该产品将记忆能力封装为SDK和API,通过时空知识图谱(STKG)技术,以时间和空间作为记忆的物理锚点,支持视频、音频、对话、图片等全模态输入。与市面上大多数基于RAG的方案不同,OmniMemory通过构建结构化知识节点,将时间、地点、人物、事件之间的关系进行建模,从而实现了更高精度的记忆检索。例如,当用户询问“我上次去杭州是什么时候”或“我最近见过哪些朋友”时,系统能够准确召回相关信息。

在赵翔看来,时间性是记忆的核心要素。其他记忆产品通常将时间作为节点的属性进行记录,但在召回时仍依赖语义匹配,这可能导致召回结果包含相互矛盾的记忆。例如,用户昨天说“我最近失眠很严重”,今天说“我昨晚睡眠好多了”,RAG方案可能同时召回这两条信息,导致模型困惑。而OmniMemory的时空知识图谱能够识别这是同一状态维度上的变化,即“睡眠状态”从“失眠”转变为“改善”,从而在召回时优先选择最新状态。

为了实现这一目标,丘脑智能构建了一套复杂的架构。该架构以时间维度为基础,支持全模态的原始素材输入,包括视频帧中的人脸、物体、动作、场景等信息,文本对话的结构化处理,以及语音的嵌入和转录。在认知层,系统模仿人类记忆方式,从原始素材中抽象出时序事件,并通过算法聚类身份实体,形成“谁在哪里做了什么”的结构化记忆。最上层的状态层则捕捉更细粒度的状态转换,例如“我今天上火”和“我明天好了”之间的变化,从而为模型提供判断依据。

张源强调,丘脑智能从创业之初就明确了高精度记忆架构的目标。他们认为,AI的终极形态是主动智能,即AI能够主动理解用户需求并提供帮助。为了实现这一目标,记忆的底层架构必须具备时序性和全模态特性。例如,系统能够根据用户近期口腔溃疡、上火、失眠的状态,推断出用户当前不宜食用辛辣食物或咖啡,并在未来状态变化时自动更新建议。

在主动智能的实现路径上,丘脑智能正在探索“潜空间记忆”技术。赵翔解释道,用户在与AI交互过程中会积累大量偏好和习惯信号,这些细粒度信息对于个性化服务极具价值。潜空间记忆通过从图谱中抽取偏好信息构建子图,并将其压缩为稠密向量,使模型能够自然理解用户的每一个需求点。这一过程类似于推荐算法的冷启动阶段:用户最初刷到不感兴趣的视频,但通过几次点赞行为,系统逐渐捕捉到其偏好,后续推荐内容便愈发精准。

然而,潜空间记忆的实现面临技术挑战。如何确保模型在压缩信息时不丢失语义,以及如何构造端到端数据以支持强化学习,都是需要攻克的难题。尽管如此,张源和赵翔认为这一方向具有巨大潜力,可能催生面向C端的主动智能超级应用。他们比喻道,互联网初期用户通过搜索引擎获取信息,推荐算法的出现催生了抖音等超级应用;如今AI生态中,用户主要在DeepSeek、ChatGPT等平台上提问,未来可能出现基于主动智能的超级应用,彻底改变人机交互方式。

在商业化方面,丘脑智能已启动内测,客户涵盖IP运营、陪伴类解决方案供应商、纯软件陪伴产品等领域。张源表示,公司首先对标supabase,通过降低记忆使用门槛吸引开发者,随后在记忆底座能力成熟的基础上,期待自然生长出主动智能的ToC应用。不同行业对记忆的需求存在差异:面向女性用户的陪伴产品更关注高精度记忆,以捕捉习惯喜好和恋爱细节;具身机器人对记忆的需求则更为刚性,例如记住用户物品的存放位置。针对不同客户类型,丘脑智能提供了私有化部署加API、联合建模等多样化解决方案。

赵翔补充道,潜空间记忆的构建需要积累大量用户交互行为数据。这些数据经过脱敏处理,不包含个人身份信息,但包含人类通用的行为逻辑,例如“人类表达愤怒时期望得到的安抚方式”。通过压缩海量交互行为为机器可读的稠密向量,系统能够训练出更懂用户的潜空间模型。这一过程与推荐算法类似:用户初始行为样本有限时,推荐内容可能不精准,但随着样本积累,系统逐渐掌握用户偏好,推荐效果显著提升。

在成本控制方面,丘脑智能进行了极限测试。结果显示,在1000万向量边的约束下,系统存储极限可达1570天(不考虑遗忘机制);若引入遗忘机制,则能以极低成本实现终身记忆。这一特性为大规模商业化应用提供了可能。

关于融资计划,张源透露,公司自2025年3月开始筹备,11月正式注册,12月在Benchmark评测中刷新SOTA记录后,受到投资机构广泛关注。目前融资进程正在积极推进,但团队坚持在首个里程碑达成前依靠自有资金运营。他们认为,创始团队需在极限条件下验证信心和能力,再考虑外部融资。

在开源策略上,丘脑智能计划通过代差代际开源降低记忆使用门槛。张源表示,单纯开源代码不足以实现记忆能力的普及,公司更注重构建开发者生态,通过自然语言调用或一行代码调用的方式,使记忆成为AI应用的标配。他们相信,每一次交互范式的变革都会引发新一轮高增长,从按键手机到智能手机、从搜索到推荐的转变均印证了这一点。丘脑智能的目标是成为AI时代主动智能超级应用的基础设施提供商。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version