Reddit宣布起诉Perplexity等未经授权抓取数据训练AI模型

2025年10月23日 12:13 次阅读 稿源:蓝点网 条评论

知名互联网论坛 Reddit 日前宣布对 Perplexity、SerApi、OxyLabs、AWMProxy 等公司提起法律诉讼,指控这些公司未经允许抓取 Reddit 论坛上的数据并进行非法使用。

此前 Reddit 已经起诉 Claude AI 模型开发商 Anthropic 指控后者未经授权抓取数据训练 AI 模型,对 Reddit 来说现在其海量帖子和用户数据就是最宝贵的财富,这可以出售给 AI 公司用来训练模型。

Perplexity 抓取数据主要是为了训练自己的人工智能模型,其他三家公司则侧重于抓取数据出售给其他 AI 公司,这也算是另类互联网掮客,通过各种技术手段突破网站限制非法抓取数据,然后再将其出售给 AI 公司。

另外 Perplexity 还被发现不遵守 robots.txt 协议,也就是即便网站在文件中明确说明禁止其爬虫抓取,也会被 Perplexity 的爬虫忽略并继续抓取数据,robots.txt 属于君子协定。

目前 Reddit 已经向 Perplexity 发出停止令,要求后者停止未经授权抓取 Reddit 论坛中的任意内容,不过 Perplexity 称并未使用 Reddit 数据,但测试显示 Perplexity 的聊天机器人回答中仍然会继续引用 Reddit 的内容,显然 Perplexity 在说谎。

不过 Perplexity 也给出自己的回应:Perplexity 尚未收到诉讼通知,但我们将始终积极争取用户自由、公平获取公共知识的权利。我们始终秉承原则和负责任的态度,利用精准的人工智能提供事实回答,绝不容忍任何威胁开放性和公共利益的行为。

对文章打分

Reddit宣布起诉Perplexity等未经授权抓取数据训练AI模型

1 (50%)
已有 条意见

    最新资讯

    加载中...

    编辑精选

    加载中...

    热门评论

      招聘