引言
Aeneas团队推出了首个用于上下文化古代铭文的模型,旨在帮助历史学家更好地解读、归属和恢复不完整的文本。古罗马世界的书写无处不在,从帝国纪念碑到日常物品的铭文,涵盖政治涂鸦、爱情诗和商业交易等,铭文为现代历史学家提供了丰富的日常生活多样性洞见。
Aeneas的背景与功能
许多铭文往往是残缺的、风化的或故意损坏的。没有上下文信息,恢复、定年和定位几乎是不可能的。Aeneas的推出极大加速了这一复杂而耗时的工作。它可以在几秒钟内从数千条拉丁铭文中检索文本和上下文的平行关系,帮助历史学家进行解读。
Aeneas不仅可以适用于其他古代语言、文字和媒介,还能帮助更广泛地连接历史证据。它与诺丁汉大学联合开发,并与华威大学、牛津大学和雅典经济与商业大学的研究人员合作。为了让更多人受益,我们还提供了Aeneas的互动版本,供研究人员、学生和教育工作者免费使用。
Aeneas的先进能力
Aeneas的功能包括:
- 平行搜索:在大量拉丁铭文中搜索平行文本,通过将每个文本转化为历史指纹,帮助历史学家将铭文放置于更广泛的历史背景中。
- 处理多模态输入:Aeneas是首个使用多模态输入确定文本地理来源的模型,分析文本和铭文图像。
- 恢复未知长度的缺口:首次能够恢复缺口长度未知的文本,适用于处理严重损坏的资料。
- 先进性能:在恢复损坏文本及预测写作时间和地点方面设立了新的基准。
Aeneas的工作原理
Aeneas是一个多模态生成神经网络,输入包括铭文的文本和图像。我们用拉丁铭文数据集(LED)训练Aeneas,包含超过176,000条铭文。
模型使用基于变换器的解码器处理文本输入,特定网络处理字符恢复和定年,地理归属也使用铭文图像作为输入。解码器从LED中检索相似铭文,按相关性排名,并使用“嵌入”技术提取平行文本。
结论
Aeneas不仅加速了历史学家的工作,还扩展了他们的视野,提供了新的定量方式来参与长期的历史辩论。通过与历史学家的合作,Aeneas展示了AI如何与人类专家的知识结合,推动历史研究的未来。
博主点评: Aeneas的推出标志着历史研究进入新时代,AI的强大能力不仅助力文本的恢复与解析,还能为历史学家提供更深层次的洞察。这一技术的开源与互动版本也极大地促进了学术界的合作与知识共享,值得关注!