谷歌_AI_创造古籍解读新高度_错误率极低_表现堪比顶级专家

2025-11-18

科技媒体 golem 报道,谷歌正通过 AI Studio 测试一款尚未命名的全新 AI 模型,其在破译难辨历史手稿方面的表现已接近专业人类学者。


核心数据:错误率低至 0.56%


历史学家 Mark Humphries 使用专门构建的基准数据集,对该模型进行了系统测试:


* 处理 5 份高难度历史手稿时,整体字符错误率约 1.7%

* 大部分错误来自标点、大小写,而非词语识别

* 若排除这些模糊标记,错误率进一步降至 0.56%

* 相当于 每 200 个字符仅出现 1 个错误


这一水平已接近专业古籍转写人员。


测试样本难度极高


文档涵盖 18~19 世纪多种手写体,存在:


* 字迹潦草

* 拼写不统一

* 语法不规范


模型依然保持高准确度,显示其对历史手写风格的强泛化能力。


亮点:不仅能转写,还能“推断历史”


在解析 18 世纪商人日记时,有记录写着购买糖“145”(未写单位)。


模型给出的却是:


> “14 磅 5 盎司”


研究人员追查后发现,AI 通过:


* 反向计算账本总价

* 结合当时英国货币体系(磅/先令/便士)

* 推断对应的重量单位


这一推理能力,已超越单纯 OCR,更像具备“历史常识 + 推断能力”的混合型系统。


当前限制


Humphries 指出:


* 模型以 A/B 测试形式零星出现

* 难以系统性获取大量样本

* 当前仅测试了基准数据集 约 10%


但早期结果已相当亮眼。


---


如果你需要,我还能帮你做:


再精简一版(微博/短视频脚本)

标题 10 选项

分类表(栏目 / 首页 / 快讯关键词)

告诉我你要哪个版本~



分享
写评论...