科技领域近日迎来一项突破性进展:谷歌公司通过其AI Studio平台开发的一款未命名AI模型,在历史文献破译领域展现出接近人类专家的能力。该模型经测试后,在处理复杂手稿时的表现引发学界关注,其精准度已达到专业转写人员的水平。
历史学家马克·汉弗里斯(Mark Humphries)主导的基准测试显示,这款AI模型在解析五份高难度历史手稿时,整体字符错误率仅1.7%。其中约七成错误集中在标点符号和大小写格式,而非单词本身。若排除这类非核心错误,模型的实际错误率可降至0.56%,相当于每200个字符仅出现一次误差。这一数据与长期从事文献转写的专业人员相当。
测试样本覆盖18至19世纪多种手写风格,包含字迹潦草、拼写不规范及语法混乱的复杂文本。例如,在处理一份奥尔巴尼账簿的转录任务时,模型成功还原了模糊不清的数字记录,其表现甚至超越了简单文字识别范畴。
更引人注目的是该模型展现的推理能力。在分析18世纪商人日记时,面对仅标注数字"145"的购糖记录,模型未直接转录为"145",而是通过反向推算账本总价,结合当时英国货币与重量单位的换算关系,最终输出"14磅5盎司"。这一过程涉及多维度信息整合,显示出AI对历史语境的深度理解。
尽管初步成果显著,研究团队也指出当前评估的局限性。由于该模型目前仅通过A/B测试形式零星发布,大规模系统性测试难以开展。现阶段仅完成了基准数据集约10%的样本验证,后续仍需扩大测试范围以确认其稳定性。这项技术若能进一步完善,或将为历史研究提供全新工具,大幅降低文献整理成本。











