第二届世界中国学大会接近尾声时,“数智时代下的中国学研究”成为各场次讨论的焦点话题。从主论坛到分会场,这一主题引发了学界的广泛关注。当人工智能技术开始介入古籍研究,新的机遇与挑战随之浮现。学者们如何应对海量生成内容带来的辨别难题?英国杜伦大学计算机科学系助理教授德龙在接受专访时,分享了他的思考与实践。
德龙的研究跨越人文与技术两大领域。二十余年来,他专注于运用数字方法处理中文历史文本,见证了“数字人文”从边缘走向主流的过程。目前,他带领的团队正尝试通过人工智能技术,实现古代典籍的自动摘要、多语言翻译及文化背景阐释。“我们希望在传统学术与现代技术之间搭建一座桥梁,”德龙解释道,“这不仅是工具的革新,更是研究范式的转变。”
对于“人机协同”是否已成为中国学研究的必然趋势,德龙给出了肯定的回答。他指出,这种协作模式并非伴随大语言模型的出现而诞生,其历史可追溯至上世纪七八十年代。当时,首批人文与历史数据库已初步建立,中国近现代文献也包含其中。几十年来,学者们始终在利用这些数字资源,传统文献研究者亦不例外。“我们早已身处人机协作的时代,只是当下的形式正在发生深刻变化,”德龙说。
谈及投身中国学研究的初衷,德龙回忆起自己从数学到哲学的学术轨迹。本科阶段主修数学的他,在北京学习了三年普通话后,硕士阶段转向哲学研究。“墨家学派关于语言与逻辑的论述深深吸引了我,”德龙提到,“哲学与数学在语言哲学领域有着紧密的联系,许多理论都源于数学和逻辑学的启发。”这种跨学科的背景,为他后来结合人工智能与中国学研究奠定了基础。
在开放科学日益重要的今天,德龙特别强调了中国AI开源模型的国际意义。他注意到,近期中国发布的大型语言模型正在全球学界产生显著影响。“这种开放姿态有助于弥合认知鸿沟,推动双向交流与深度协作,”德龙说。他的研究工作高度依赖开源模型,而中国AI开源模型提供的支持尤为突出。“我不仅乐见其成,更希望这种开放趋势能够持续。”
关于AI在中国文化传播中的作用,德龙认为其潜力与局限同样明显。一方面,AI的发展速度极快,去年还难以完成的任务,今年可能已轻松实现。例如,通过设置检索基准,可以有效减少AI“幻觉”问题,提升其处理古籍内容的准确性。另一方面,AI在逻辑推理方面仍存在明显短板,例如从已知事实中推导出新结论的能力。“这是当前最优模型的普遍弱点,也是全球计算机科学家努力突破的方向,”德龙指出。
面对AI带来的挑战,德龙为青年学者提出了两条核心建议:保持批判性思维,积极进行实验。他强调,当前AI生成的内容看似合理,实则可能包含错误信息,这对学者提出了更高要求。“必须清醒认识技术的局限,同时掌握有效使用它的方法,”德龙说。他承认,这不仅是青年学者面临的挑战,对他自己而言同样如此。“技术迭代极快,我们需要不断判断:哪个工具可靠?哪种方法适合我的研究?如何取得最优结果?”