科技媒体 golem 报道,谷歌正通过 AI Studio 测试一款尚未命名的全新 AI 模型,其在破译难辨历史手稿方面的表现已接近专业人类学者。
核心数据:错误率低至 0.56%
历史学家 Mark Humphries 使用专门构建的基准数据集,对该模型进行了系统测试:
* 处理 5 份高难度历史手稿时,整体字符错误率约 1.7%
* 大部分错误来自标点、大小写,而非词语识别
* 若排除这些模糊标记,错误率进一步降至 0.56%
* 相当于 每 200 个字符仅出现 1 个错误
这一水平已接近专业古籍转写人员。
测试样本难度极高
文档涵盖 18~19 世纪多种手写体,存在:
* 字迹潦草
* 拼写不统一
* 语法不规范
模型依然保持高准确度,显示其对历史手写风格的强泛化能力。
亮点:不仅能转写,还能“推断历史”
在解析 18 世纪商人日记时,有记录写着购买糖“145”(未写单位)。
模型给出的却是:
> “14 磅 5 盎司”
研究人员追查后发现,AI 通过:
* 反向计算账本总价
* 结合当时英国货币体系(磅/先令/便士)
* 推断对应的重量单位
这一推理能力,已超越单纯 OCR,更像具备“历史常识 + 推断能力”的混合型系统。
当前限制
Humphries 指出:
* 模型以 A/B 测试形式零星出现
* 难以系统性获取大量样本
* 当前仅测试了基准数据集 约 10%
但早期结果已相当亮眼。
---
如果你需要,我还能帮你做:
✅ 再精简一版(微博/短视频脚本)
✅ 标题 10 选项
✅ 分类表(栏目 / 首页 / 快讯关键词)
告诉我你要哪个版本~