近日,美國《華盛頓郵報(bào)》揭露了關(guān)于2025年夏天發(fā)生的一起眾多作家聯(lián)名訴人工智能公司Anthropic的更多幕后真相。為訓(xùn)練其公司新開發(fā)的人工智能模型,該公司曾銷毀數(shù)百萬冊實(shí)體書籍,將文件從紙質(zhì)轉(zhuǎn)換為數(shù)字格式,這一做法的“優(yōu)勢”在于成本低廉且很可能合法。該公司最終在去年 8 月份同意支付 15 億美元達(dá)成和解。


據(jù)最新披露的關(guān)于這起案件的相關(guān)文件,Anthropic 的領(lǐng)導(dǎo)層認(rèn)為書籍對于訓(xùn)練其人工智能模型“至關(guān)重要”,其中一位聯(lián)合創(chuàng)始人表示,書籍將教會機(jī)器人“如何寫好文章”,而不是模仿“低質(zhì)量的網(wǎng)絡(luò)用語”。


電影《華氏451度》(1966)劇照。


整個行動被命名為“巴拿馬計(jì)劃”。Anthropic 公司斥巨資從圖書館、在線二手書店以及像斯特蘭德書店這樣的實(shí)體書店購書,打造了一個龐大的圖書館。該公司將拆解書籍變成了一種藝術(shù)。他們使用“液壓切割機(jī)”將從二手書零售商那里收購的數(shù)百萬冊書籍“整齊地切割”出來,然后用“高速、高質(zhì)量、生產(chǎn)級掃描儀”掃描書頁。之后,他們會安排一家回收公司來回收這些被拆解的書籍——畢竟,誰也不想浪費(fèi)。


這一行為在現(xiàn)有法律規(guī)定中具有相當(dāng)?shù)碾[蔽性。據(jù)Anthropic的律師稱,法官在此前的盜版案中模棱兩可的判決留下了一個法律漏洞。法官裁定,如果用于訓(xùn)練人工智能的書籍是以“變革性”的方式使用,那么這種做法在法律上是合法的,類似于用書籍教孩子,或者購買書籍后可以隨意處置——例如,二手書店就是一個允許這種做法的法律先例??偠灾N毀書籍使該公司得以逃避向作者支付報(bào)酬。


據(jù)《華盛頓郵報(bào)》報(bào)道,一份新近解封的內(nèi)部規(guī)劃文件寫道:“‘巴拿馬計(jì)劃’是我們試圖以破壞性的方式掃描全世界所有書籍的行動。我們不想讓別人知道我們正在進(jìn)行這項(xiàng)計(jì)劃?!?/p>


在轉(zhuǎn)向?qū)嶓w書之前,Anthropic公司就因盜版數(shù)百萬冊電子書而備受爭議。2021年,Anthropic聯(lián)合創(chuàng)始人本·曼恩(Ben Mann)自作主張地從LibGen下載了數(shù)百萬冊書籍。LibGen是一個在線“影子圖書館”,提供大量可免費(fèi)獲取的盜版文本。


Anthropic并非唯一一家使用盜版書籍的公司。在另一起作者訴訟案中,文件揭露了馬克·扎克伯格的Meta公司也從LibGen等影子圖書館竊取了數(shù)百萬冊書籍,一些員工意識到這有點(diǎn)可疑。他們在內(nèi)部通訊中寫道:“如果媒體報(bào)道暗示,我們使用了明知是盜版的數(shù)據(jù)集,例如 LibGen,這可能會削弱我們在這些問題上與監(jiān)管機(jī)構(gòu)的談判地位?!?/p>



參考鏈接:

1. Inside an AI start-up’s plan to scan and dispose of millions of books

https://www.washingtonpost.com/technology/2026/01/27/anthropic-ai-scan-destroy-books/

2. Anthropic didn’t want us to know that they were destroying millions of books to feed their software.

https://lithub.com/anthropic-didnt-want-us-to-know-that-they-were-destroying-millions-of-books-to-feed-their-software/

3. Anthropic Knew the Public Would Be Disgusted by How It Was Destroying Physical Books, Secret Documents Reveal

https://futurism.com/future-society/anthropic-destroying-books


編譯/申璐

編輯/張婷

校對/盧茜