Reddit首席执行官表示,微软需要付费才能抓取其网站的数据
2024-08-01 06:25:29AI云资讯115322
(AI云资讯消息)在与谷歌和OpenAI达成协议后,Reddit首席执行官Steve Huffman呼吁微软和其他公司,如果它们想继续抓取该网站的数据,就必须付费。

“如果没有这些协议,我们就无法控制或了解我们的数据是如何展示和使用的,这让我们不得不阻止那些不愿按照我们希望或不希望的方式使用数据的公司。”Huffman在本周的一次采访中说。他特别点名了微软、Anthropic和Perplexity,称阻止这些公司真是件令人头痛的事。
Reddit在过去几个月里一直在加大对抓取者的打击力度。7月初,其robots.txt文件被更新,以阻止没有协议的网络爬虫。然后人们开始注意到,Reddit的结果只在谷歌搜索结果中可见——Reddit为此向谷歌支付了数据显示费用——而在其他搜索引擎如必应中则不可见。
Huffman表示,微软一直在使用Reddit的数据来训练其AI,并在必应搜索结果中概括其内容“但没有告诉我们”,并且Reddit的数据还通过必应API出售给了其他搜索引擎。在采访中,他引用了微软AI首席执行官Mustafa Suleyman在一次会议上的评论,称互联网上的公共数据是免费软件。
Huffman表示,微软、Anthropic和Perplexity等公司认为互联网上的所有内容都可以供他们免费使用,这才是他们的真实立场。
针对Reddit搜索结果最近在必应中消失一事,微软搜索业务负责人Jordi Ribas在X上表示,“Reddit已经阻止必应爬取其网站进行搜索,偏爱另一家搜索引擎,并影响了来自必应和基于必应的搜索引擎的竞争。”微软发言人Caitlin Roulston上周分别告诉外媒,“我们尊重网站提供的指导,即不希望其页面上的内容被用于我们的生成式AI模型。”
Huffman提到OpenAI最近宣布的SearchGPT就是他想要复制的模式,由于今年早些时候双方达成了协议,SearchGPT搜索引擎将能够显示Reddit的搜索结果。Reddit发言人蒂Tim Rathschmidt表示,该公司迄今为止达成的所有内容许可协议中,都没有包含对数据的独家使用案例。
通过要求许可协议,Reddit正加入更多传统的媒体出版商的行列,要求为让其内容为生成式AI提供数据而付费。Huffman表示,“我认为从搜索引擎的传统价值交换已经发生了变化,搜索、摘要和训练正在融合,爬取数据以换取流量的交换价值正在变得模糊。”
截至目前,微软、Anthropic和Perplexity的发言人尚未对此事置评。
相关文章
- 微软将通过动态CPU调节技术提升Windows 11的性能
- OpenAI宣布与AMD、英伟达、英特尔、微软及博通达成超级合作,合力加速AI发展
- 微软放弃Xbox Copilot人工智能
- 微软发布2026财年第三季度财报,Xbox收入下滑,云业务攀升
- 双城奔赴,智领未来:领驭科技亮相2026微软AI Tour上海·香港站
- 微软在Word、Excel和PowerPoint中推出“氛围工作”功能
- 微软为Copilot测试类似OpenClaw的AI机器人
- 微软开始从Windows 11应用中移除Copilot按钮
- 2026 AI智能体端侧变革来袭,微软/微美全息押注生成式Agent开启高成长篇章
- 微软重组AI领导层,任命新负责人雅各布·安德烈欧执掌Copilot
- 微软的Xbox模式将登陆Windows 11电脑
- 微软开发者大会将于6月在旧金山举行
- 微软将为Windows 11增加内置网络速度测试功能
- 微软通过月度安全更新对Windows安全启动证书进行升级
- 微软计划利用高温超导材料设计能效更高的数据中心
- 谷歌云客户业务负责人重返微软,出任安全主管
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









