古羅馬捲軸解碼之人工智慧競賽

Ancient Papyrus Scrolls At The National Library Of Naples

在八月底的一個星期六晚上,21歲的電腦科學生路克‧法里托(Luke Farritor)從朋友在奧馬哈的家裡開的派對回家的路上,他在手機上看到了某些東西,他說幾乎讓他落淚倒在地上。

法里托在過去六個月裡,經常每週超過40小時地研究古代捲軸的3DX光照片。當他在派對時收到消息,說新的捲軸片段已經上傳了掃描和虛擬展開。在周圍音樂響起時,他遠程登入自己的PC,讓他建立的AI模型來偵測從前捲軸掃描中的墨跡來處理新的片段,然後回到派對。

開車回家後,在從停車場步行回學校宿舍的路上,法里托想起了捲軸,於是查看手機。

在他手機螢幕上出現了三個古希臘字母—π, ο, ρ(pi, omicron, rho)。法里托是近2000年來第一個讀到這些字母的人。他告訴時代雜誌說:「我完全驚慌失措。」

Herculaneum papyri Luke Farritor

法里托在10月12日獲得4萬美元獎金,這項突破讓他成為成千上萬競爭者中間爭奪赫庫蘭尼姆捲軸閱讀權的一員。法里托的工作建立在其他競爭者的工作之上,總共已頒發36項獎金。在Discord通訊平台上,競爭者之間的氣氛是合作的—他們分享代碼和工作中不斷出現的結果,以及他們買的南瓜和被競賽啟發的詩—即使大獎700,000美元的爭奪加劇。

這場競賽由發明虛擬展開技術的學者和在新冠病毒封鎖期間對羅馬人著迷的科技投資者組織。無論誰獲勝,古代知識的寶庫很快將被打開。

捲軸來自何處?

公元79年,維蘇威火山爆發,將義大利西南部的赫庫蘭尼姆(Herculaneum)埋在65英尺厚的熱泥漿和氣體下。赫庫蘭尼姆外面是羅馬世界最豪華的別墅之一,據信屬於凱撒的岳父盧基烏斯‧卡爾普尼烏斯‧皮索‧凱索尼努斯(Lucius Calpurnius Piso Caesoninus)。

近1700年後,農民在挖井時意外發現別墅的遺跡。在其中,他們發現大量看起來像煤塊的東西。事實上,這些是捲軸——也稱為莎草紙捲軸,因為它們是用莎草紙製成的——它們在火山爆發產生的高溫低氧條件下已經碳化。許多碳化捲軸在考古學家注意到有微弱字母跡象之前已被丟棄。從那時起,他們開始收集它們。

多年來,人們曾多次嘗試展開捲軸,但大多數都因為它們太脆弱而將它們破壞掉。其中一個相對成功的嘗試是1756年,梵蒂岡手稿館館長安東尼奧·皮亞焦(Antonio Piaggio)發明了一台機器,可以毫米毫米地緩慢展開捲軸。第一次展開捲軸花了四年時間。

1802年,那不勒斯國王費迪南多四世送給拿破崙·波拿巴六捲捲軸,後被送到巴黎的法國學院保管。據傳說,國王後來送給當時的英國攝政王,後來的英國國王喬治四世18捲捲軸,以換取18隻袋鼠,這些袋鼠被飼養在那不勒斯弗洛里迪亞納別墅的花園裡。

學者估計未開封捲軸中可能包含30卷以上的新文字,涵蓋了廣泛的作者和類型。

虛擬展開的發明

肯塔基大學計算機科學教授布倫特·希爾斯(Brent Seales)在2002年在倫敦的英國圖書館工作,當時他和一位同事正在建立《貝奧武甫》手稿的數字版本。一位圖書館保護員拿出一份手稿,因為它已經受損太嚴重無法展開。

「他們對我說:’這個怎麼辦?如果你有一本書無法展開來拍照怎麼辦?’」希爾斯告訴時代雜誌。

希爾斯開發了一種三步驟方法來閱讀捲軸而不展開它們。第一步,使用X光斷層掃描技術對捲軸進行3D掃描,這與CT掃描使用的技術相同。第二步,分析掃描結果找到捲軸層次,然後虛擬展開層次。第三步,在展開的層次中尋找墨跡的跡象。

2002年,他在美國檔案管理學會上用人工製作的捲軸展示了這種技術。通常嚴肅和學術的觀眾當場驚呼出聲,希爾斯說。

虛擬展開在實際應用中證明了其價值,2006年,希爾斯使用這種技術閱讀了從另一本書脊中提取的片段。這段文字後來證明是用希伯來文寫的《傳道書》。另一項突破發生在2015年,希爾斯和他的團隊虛擬展開了恩-蓋迪捲軸,一個被認為來自公元3-4世紀的碳化片段。

希爾斯在2004年了解到赫庫蘭尼姆捲軸,並在2009年首次對它們進行掃描。2019年,為了獲得更高解析度掃描,他在英國牛津的粒子加速器鑽石光源中心掃描了法國學院的兩卷捲軸。今年年初,希爾斯的博士生史蒂芬·帕森(Stephen Parsons)證實機器學習可以從掃描中偵測到墨跡。

維蘇威挑戰

2020年初,科技投資家和行政人員納特·弗里德曼(Nat Friedman)閱讀《羅馬24小時》後陷入了兔子洞。他承認這本書是為八年級生寫的。

「我非常不負責任地待到很晚才完成這本書。當時我是GitHub的CEO,早上有重要會議。但我真的很喜歡它,」弗里德曼說。

數週以來,弗里德曼繼續探索兔子洞。他烤了羅馬人在龐貝城發現的一種酸麵包panis quadratus。「我用他們當時的遺傳小麥做的,」弗里德曼說。「味道很好—很美味。」他吃盡書本和維基百科關於羅馬人的內容,對羅馬人著迷。

最後,他偶然看到維基百科關於赫庫蘭尼姆捲軸的頁面,了解到希爾斯的解碼工作。2022年9月,在多年沒有捲軸消息的情況下,弗里德曼很想支持希爾斯的工作,於是邀請他參加在加州索諾馬郡舉辦的75人露營活動,希望希爾斯能在活動中遇到資助者或合作夥伴。

弗里德曼說服希爾斯發表演講,並拉攏他認識的人參加,但最終沒有結果。「布倫特將空手回肯塔基,我當時感到很失望和尷尬。」為了彌補,弗里德曼和朋友丹尼爾·格羅斯(Daniel Gross)在希爾斯酒店吧見面。在那裡,受GitHubCEO時期在開源社區工作的啟發,弗里德曼提出舉辦競賽的主意—維蘇威挑戰。

「布倫特說他研究這個已經很久了。他認為最終會解決,但不知道需要多長時間—可能需要幾年,」弗里德曼說。