被指在 AI 训练中滥用盗版书籍,Adobe 面临集体诉讼
最新 12 月 18 日消息,据外媒 TechCrunch 今日报道,一项由作家 Elizabeth Lyon 发起的集体诉讼对 Adobe 发出新的指控,称对方在训练 SlimLM 语言模型时,使用了包括 Lyon 本人的作品在内的大量盗版书籍。Lyon 来自俄勒冈州,长期从事非虚构写作,并出版多本写作指导类书籍。
Adobe 方面介绍,SlimLM 是一套面向移动设备文档辅助场景的小语言模型,其预训练基础为 SlimPajama-627B 数据集。该数据集由 Cerebras 于 2023 年发布,被描述为去重、多语料的开源集合。然而诉讼认为,SlimPajama 本身来源存在问题。
诉讼文件指出,SlimPajama 是在复制并加工 RedPajama 数据集的基础上生成的,而 RedPajama 包含广受争议的 Books3 数据集。Books3 收录约 19.1 万本书籍,其中包含大量受版权保护作品。
诉讼明确指出,作为 RedPajama 的派生数据集,SlimPajama 同样包含 Books3 内容,因此不可避免地纳入了原告及其他作者的版权作品。
围绕 Books3 和 RedPajama 的争议,早已不止于 Adobe。此前,苹果和 Salesforce 均因涉嫌在 AI 训练中使用相关数据集而遭到起诉,相关案件指控企业未经授权使用受版权保护内容。
在更广泛的行业背景下,类似诉讼正在成为常态。AI 模型对训练数据规模的高度依赖,使数据来源问题频频引发法律风险。今年 9 月,Anthropic 同意向多名作者支付 15 亿美元(最新注:现汇率约合 105.77 亿元人民币),就其训练 Claude 时使用盗版作品的指控达成和解。该案件被外界视为 AI 训练版权争议的重要节点,然而行业内持续扩大的法律挑战仍未终结。
《被指在 AI 训练中滥用盗版书籍,Adobe 面临集体诉讼》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
为给孩子减负!教育部:普通高中严格控制考试次数、小学一二年级不进行纸笔考试
快科技12月18日消息,近日,教育部印发《关于进一步加强中小学日常考试管理的通知》,要求减少日常考试测试频次,提升日常考试质量,强化考试安全风险防范,减轻学生过重学业负担,促进学生全面... -
30岁中国健美冠军为何突然猝死 流感后坚持训练:医生紧急提醒
快科技12月18日消息,近日30岁的健美冠军王昆突然离世被挤上热搜,这也引来网友的热议。一名自称为王昆生前多年好友的回应:“王昆是在14日下午走的,死亡原因为心源性猝死。”据... -
吃不饱穿不暖能活更久!真不骗你
此前,中国工程院院士张运在接受采访时提到,吃八成饱、有饥饿感会启动长寿基因;穿不暖、稍微有些寒冷感,也会启动长寿基因。表面上看,这两句话似乎有些反常识——我们常用&ldquo... -
我国首个!川藏高原腹地特高压工程建成投运 输电距离近1900公里
快科技12月18日消息,央视新闻报道,我国首条深入川藏高原腹地的特高压工程——国家电网金上—湖北±800千伏特高压直流输电工程,近日正式投运。该工程总投资334亿元,起... -
储量惊人!我国发现亚洲最大的海底巨型金矿:累计探明金资源储量3900余吨
快科技12月18日消息,据山东省烟台市海洋发展和渔业局官方发布消息,莱州市发现了亚洲最大的海底金矿。官方信息中提到,莱州市三山岛北部海域新发现国内唯一、亚洲最大的海底巨型金矿,莱州市...

















