维基百科准备向数据爬虫收费

维基百科网站表示,已经发出公告,要求人工智能公司停止抓取数据,并为维基百科网站支付费用。虽然维基百科是免费网站,而且处于全球前七位,但维基百科依然拒绝任何数据爬取。

2025年11月10日,维基百科与非营利组织维基媒体基金会在一篇博客文章中表示,该基金会希望人工智能公司停止抓取其数据用于训练人工智能模型,这些公司应该付费使用其应用程序编程接口。

维基媒体表示,人工智能公司需要高质量的人工策划信息来保持他们的模型正常工作。维基百科广泛的志愿者编辑网络确保其信息来源良好,其内容覆盖300多种语言。

与此同时,运营维基百科网站的成本极高。Semrush的数据显示,维基百科网站是世界上访问量第七大的网站。根据维基媒体基金会的审计,2023-2024财年维基百科的运营成本为1.79亿美元。维基媒体主要通过捐款维持维基百科的运营,不做广告。

但是,人工智能正在改变人们的研究习惯。人们不再在维基百科上研究主题,而是转向人工智能来回答他们的问题。虽然维基百科是免费使用的,但如果人们使用ChatGPT绕过它,维基百科将无法在维基百科主页的顶部看到捐款请求,网站可能会亏损。

维基媒体要求人工智能公司付费使用其企业API,这将使他们“能够大规模、可持续地使用维基百科内容,而不会对维基百科的服务器征税,同时也使他们能够支持我们的非营利使命。”

谷歌、OpenAI、Meta、困惑、Anthropic、微软、DeepSeek和xAI的代表没有立即回复这一请求,维基媒体的代表也没有立即回应置评请求。

谷歌确实在2022年同意与维基媒体达成协议,以商业方式访问维基百科内容。

维基媒体提出这一要求之际,在线内容创作者正在反对人工智能公司在未经许可或付款的情况下使用在线数据。彭斯克、《纽约时报》和新闻集团等在线出版商正在起诉人工智能公司侵犯版权。另有其他公司,如美联社和路透社,已经与人工智能公司签署了许可协议。

在人工智能繁荣时期,大型科技股飙升至平流层高度。上个月底,英伟达短暂成为世界上第一家5万亿美元的公司,微软和谷歌的母公司Alphabet在今年早些时候突破了4万亿美元的门槛。

Be the first to comment

Leave a Reply

Your email address will not be published.


*