Reddit宣布起诉Perplexity等未经授权抓取数据训练AI模型

知名互联网论坛 Reddit 日前宣布对 Perplexity、SerApi、OxyLabs、AWMProxy 等公司提起法律诉讼，指控这些公司未经允许抓取 Reddit 论坛上的数据并进行非法使用。

此前 Reddit 已经起诉 Claude AI 模型开发商 Anthropic 指控后者未经授权抓取数据训练 AI 模型，对 Reddit 来说现在其海量帖子和用户数据就是最宝贵的财富，这可以出售给 AI 公司用来训练模型。

Perplexity 抓取数据主要是为了训练自己的人工智能模型，其他三家公司则侧重于抓取数据出售给其他 AI 公司，这也算是另类互联网掮客，通过各种技术手段突破网站限制非法抓取数据，然后再将其出售给 AI 公司。

另外 Perplexity 还被发现不遵守 robots.txt 协议，也就是即便网站在文件中明确说明禁止其爬虫抓取，也会被 Perplexity 的爬虫忽略并继续抓取数据，robots.txt 属于君子协定。

目前 Reddit 已经向 Perplexity 发出停止令，要求后者停止未经授权抓取 Reddit 论坛中的任意内容，不过 Perplexity 称并未使用 Reddit 数据，但测试显示 Perplexity 的聊天机器人回答中仍然会继续引用 Reddit 的内容，显然 Perplexity 在说谎。

不过 Perplexity 也给出自己的回应：Perplexity 尚未收到诉讼通知，但我们将始终积极争取用户自由、公平获取公共知识的权利。我们始终秉承原则和负责任的态度，利用精准的人工智能提供事实回答，绝不容忍任何威胁开放性和公共利益的行为。

对文章打分

Reddit宣布起诉Perplexity等未经授权抓取数据训练AI模型

最新资讯

编辑精选

热门评论

相关文章

OpenClaw横扫中国AI圈外媒感慨比硅谷更火爆

Anthropic CEO炮轰奥特曼：全是谎言，与军方一起作秀

阿里批准林俊旸辞职 DeepMind向千问员工抛橄榄枝

OpenAI 推出备受期待的 Windows 版 Codex 应用

在五角大楼将Anthropic列入黑名单后国防科技公司纷纷弃用Claude

OpenAI员工对公司与五角大楼达成合作协议怒火中烧

Top 10

微信新能力上线可查图片使用次数

极客湾疑似遭"全网封杀"!背后力量深不可测？

极客湾遭"封杀"引热议连YouTube视频都下架了

微信新能力上线可查图片使用次数

极客湾疑似遭"全网封杀"!背后力量深不可测？

苹果不再允许用户扛着MacBook到苹果零售店拷贝Final Cut Pro