甲骨文是中國已知最早的成體系文字,多年來也有不少專家研究及記錄載有甲骨文的文本。為保護文物和方便研究,微軟(Microsoft)夥北京師範大學研究人員,利用AI記錄和分析甲骨文字符。
甲骨文早已入選聯合國教科文組織《世界記憶名錄》,其起源可以追溯至公元前1400年至公元前1100年的商代。雖然自1899年以來,便有載有甲骨文的文物出土,但多年來科學家只能從約4,000個已識別字符中,破譯出約1,000個字符意思。
其中最大的難處是,大多出土的甲骨文文本都是記載在牛肩胛骨或海龜腹殼上。同一塊甲骨可能被多次記錄,其清晰度和完整性程度亦不同。研究人員仍然需要手動比較每張圖像,以找到重複或重疊的部分,才能將碎片拼接成一個更大、更完整的文本以供研究。
快速分辨重覆字符 提300對配對可能性
有見及此,微軟研究人員Wu與另一名團隊成員Mo,花了8至9個月時間,構建一個名為「Diviner Project」的AI模型。透過上載甲骨文文本圖片,將用AI快速將每個文本,與數據庫中的數千個其他文進行比較,以識別眾多文本中,是否有重覆的部分。
微軟指,Diviner Project曾於去年11月,利用一周的時間,便比較了100個數據庫中的181,134 件拓片。不僅發現當中有數萬個重複的文本記錄,還發現了300多對新配對。Wu則指,Diviner Project目前工作是通過將小碎片連接到大碎片,並清理重覆數據使其恢復到原始形式。期望日後可以進一步協助破譯甲骨文字符的含義。