会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 不想被OPENAI白嫖:纽约时报网站封杀GPT爬虫禁止其抓取网站内容 – 蓝点网!

不想被OPENAI白嫖:纽约时报网站封杀GPT爬虫禁止其抓取网站内容 – 蓝点网

时间:2025-04-17 06:37:47 来源:价廉物美网 作者:时尚 阅读:519次

8 月 7 日 OPENAI 公布自己的不想被OI白报网互联网爬虫 GPTBot,该爬虫是嫖纽爬虫 OPENAI 用来在全网抓爬内容然后训练 AI 模型用的。尽管多数网站允许 GPTBot 抓爬内容,站封站内不过也有些网站并不想给 OPENAI 白嫖,禁止所以在 robots.txt 文件里屏蔽了 GPTBot。其抓取网

比如知名新闻媒体《纽约时报》就在网站上封禁 GPTBot,容蓝禁止该爬虫访问纽约时报网站的点网任何内容,包括首页信息摘要等。不想被OI白报网

互联网档案馆的嫖纽爬虫存档显示,纽约时报大约是站封站内在 8 月 17 日修改 robots.txt 文件屏蔽 GPTBot 的,而在稍早的禁止时候纽约时报则修改了服务条款,明确禁止任何公司抓取其内容用来训练人工智能模型,其抓取网所以之后修改 robots.txt 协议禁止 GPTBot 也倒是容蓝可以理解。

不想被OPENAI白嫖:纽约时报网站封杀GPT爬虫禁止其抓取网站内容

纽约时报与 OPENAI 矛盾还是点网挺深的,上个月纽约时报就表示正在考虑对 OPENAI 提起法律诉讼,不想被OI白报网因为 OPENAI 侵犯了纽约时报的版权。还有两名作者也在 7 月起诉了 OPENAI,因为 OPENAI 拿他们的作品训练 GPT 模型。

对于修改 robots.txt 阻止 OPENAI 抓爬这事儿,纽约时报拒绝置评,OPENAI 则没有回复置评请求。

最后:如果你也想控制 GPTBot 的抓爬,可以在你网站的 robots.txt 文件中加入指令,例如完全禁止 GPTBot 或允许 GPTBot 抓取一部分内容。

具体操作方法请看:如何禁止OPENAI的爬虫(GPTBot)抓爬网站 附该爬虫的IP地址网段

(责任编辑:知识)

相关内容
  • CCH餐饮展首播:月收40万,老广味牛巴打云招商7月23开播
  • 篮球头像男生潮图篮球赛妨碍语杂乱对于篮球肉体的作文
  • ​卡乐比北海道薯条三兄弟 年迈人都爱的爆款零食是若何降生的?
  • 宠物饮料的风口来了,宠激活要做宠物饮料风口上的首个互联网品牌
  • 年销售额为100亿的建材/板材/家居/新批发云平台向广东省发改委存案
  • 临汾市翼城县向导鉴赏咨询菲斯顿进村落入户情景
  • 中班艺术:时尚的服饰反思(时尚教案)
  • 2019中国国内珠宝展,让你爱上玄色宝石!
推荐内容
  • 周麻婆快餐经营有哪些能耐
  • 董宇辉爆红眼前:“线上热”建议5月社零触底反弹,疫情后的报复性破费来了吗?
  • 篮球头像男生潮图篮球赛妨碍语杂乱对于篮球肉体的作文
  • 是牙刷也是洁面仪!i妹妹er伊茉合二为一打造两用电动牙刷
  • 番禺区剑桥郡加拿达外国语学校匠心教研
  • 篮球资讯博主中国小篮球联赛官网山东省篮协官网