應用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

消息稱 Meta 無視自家律師警告,使用盜版書籍訓練 AI 模型

2023-12-13 17:19 IT之家
關(guān)鍵詞:Meta

導讀:?12 月 13 日,據(jù)路透社報道,根據(jù)一起版權(quán)侵權(quán)訴訟的新文件顯示,Meta Platforms 在明知使用數(shù)千本盜版書籍訓練其 AI 模型存在法律風險的情況下,仍然一意孤行。

12 月 13 日,據(jù)路透社報道,根據(jù)一起版權(quán)侵權(quán)訴訟的新文件顯示,Meta Platforms 在明知使用數(shù)千本盜版書籍訓練其 AI 模型存在法律風險的情況下,仍然一意孤行。

image.png


據(jù)IT之家了解,該訴訟由喜劇演員 Sarah Silverman、普利策獎得主 Michael Chabon 等著名作家于今年夏天聯(lián)合發(fā)起,他們指控 Meta 未經(jīng)許可使用其作品訓練人工智能語言模型 Llama。本周一起,該案與另一起類似訴訟合并審理。

上個月,加州一位法官駁回了 Silverman 的部分訴訟,但表示將允許作者修改訴訟內(nèi)容。新訴狀中包含了 Meta 一名研究員在 Discord 聊天服務器上討論獲取數(shù)據(jù)集的聊天記錄,這可能是 Meta 知曉使用書籍可能存在版權(quán)風險的重要證據(jù)。聊天記錄中的對話顯示,他們曾討論過使用盜版書籍訓練 AI 模型的法律風險。其中,一位 Meta 研究員 Tim Dettmers 提到,Meta 的法律部門律師曾表示,如果使用這些書籍訓練 AI 模型,可能會存在法律問題。律師稱,這些數(shù)據(jù)無法使用,如果使用了的話,模型也無法發(fā)布。

今年,多家科技公司都面臨著內(nèi)容創(chuàng)作者的類似指控,他們指責這些公司在構(gòu)建生成式 AI 模型時侵犯了作品版權(quán)。

如果這些訴訟成功,可能會給生成式 AI 的發(fā)展帶來不利影響,因為這可能會增加構(gòu)建 AI 模型的成本,迫使 AI 公司向藝術(shù)家、作者和其他內(nèi)容創(chuàng)作者支付使用其作品的費用。

與此同時,歐盟關(guān)于人工智能的新臨時規(guī)則可能會迫使公司披露其用于訓練模型的數(shù)據(jù),這可能會使他們面臨更大的法律風險。

Meta 于今年 2 月發(fā)布了其第一版 Llama 大型語言模型,并公布了用于訓練的數(shù)據(jù)集列表,其中包括“ThePile”數(shù)據(jù)集的“Books3”部分。根據(jù)訴訟文件,該數(shù)據(jù)集的創(chuàng)建者曾表示,其中包含 196,640 本書籍。該公司沒有披露其最新版模型 Llama 2 的訓練數(shù)據(jù),該模型于今年夏天面向商業(yè)用戶開放。