需要幾部 AIs 來閱讀一份 PDF?

去年 11 月,眾議院監督委員會剛剛釋出來 20,000 頁來自 Jeffrey Epstein 遺產的文件,Luke Igel 和幾位朋友正在點擊瀏覽,試圖透過混亂的電子郵件串和一個實在「糟糕」的 PDF 檢視器來跟蹤對話的線索。在接下來的幾個月裡,司法部會釋出自己的文件批次,數量超過 300 萬份 – 再次,全部都是 PDFs。這是一個問題。雖然司法部對文本進行了光學字符識別,但 Igel 表示效果並不好,導致文件幾乎無法搜尋。「根本沒有界面……」詳情可參閱 The Verge。