谷歌内部文件显示谷歌要求网站必须同意免费共享数据给AI概览 或者失去所有谷歌流量
前文我们提到谷歌搜索正在将广告内容引入到 AI 概览中,AI 概览正在演变为货币化空间,这对谷歌搜索来说至关重要,因此谷歌也拒绝网站 / 出版商试图阻止谷歌使用网站数据来生成 AI 概览。
彭博社发布的谷歌内部文件显示,谷歌曾讨论过为出版商提供更精细的控制权,让出版社决定如何在人工智能搜索功能中使用网站数据,而不是让出版商最终获得选择的幻觉。
这份内部文件由谷歌搜索高管撰写,文件在美国监管机构起诉谷歌在线搜索反垄断时发布,谷歌的人工智能概览和人工智能模式可能对内容来源网站造成不利影响,因为用户只需要查看概览即可不需要点击网站,这会导致网站的流量越来越低并且没有货币化途径。
被谷歌视为红线 / 底线的建议是谷歌允许出版商阻止谷歌搜索的人工智能模型实时引用网站数据,但出版商不能选择阻止谷歌将抓取的这些网站数据用于训练人工智能概览。
被标记为可能不稳定的建议则是谷歌不应该添加任何额外的控制措施,即禁止出版商采取任何措施阻止谷歌人工智能模型使用网站数据,如果出版商不同意那可以通过 robots.txt 协议完全阻止谷歌爬虫的抓取,然而这意味着网站将无法再从谷歌搜索获得任何流量,这对于任何网站来说都是无法承受的事情。
5 月 2 日的法庭听证会透露目前出版商正在面临最后通牒,尽管 2023 年谷歌推出方案允许网站退出 AI 训练,但谷歌 DeepMind 副总裁称该方案不适用于像 AI 概览这样的搜索专用 AI 产品,出版商避免被 AI 概览抓取数据的唯一方法就是选择退出被谷歌搜索爬虫抓取。
文件还透露在 2024 年谷歌推出 AI 概览时谷歌就决定悄悄更新关于出版商控制的信息且不公开宣布,关于更新措辞的指导也表明谷歌故意让出版商更难知道他们实际上选择退出了哪些功能,以免让出版商了解 Gemini、AI 概览和谷歌其他 AI 模型训练之间的细节。
对于这份文件谷歌回应称这只是该公司在人工智能发展过程中的早期考虑列表,并不反映谷歌最终做出的决定。然而谷歌目前使用的措辞其实非常直接:标记其内容不用于 AI 概览和 AI 模式的出版商也将使其内容排除在所有形式的搜索结果之外。这无异于威胁。