网络爬虫，网络蜘蛛的问题-HQY 一个和谐有爱的空间

27

2025
03
01:01:04

网络爬虫，网络蜘蛛的问题

在观察一个 Web 服务器的日志的时候，看到一个现象，有大量的网络爬虫，或者说网络蜘蛛来访问，抓取内容。这个访问数量有些过分。
看这个截图。

排名最前的十位如下：

714,290 (36.96%)	101 (00.07%)	11.8 GiB (39.11%)	GPTBot/1.2
47,085 (02.44%)	299 (00.20%)	8 GiB (26.31%)	GoogleOther
9,350 (00.48%)	453 (00.30%)	578.1 MiB (01.87%)	meta-externalagent/1.1
35,038 (01.81%)	20 (00.01%)	470.2 MiB (01.52%)	Ai2Bot-Dolma
39,785 (02.06%)	852 (00.57%)	376.3 MiB (01.21%)	AhrefsBot/7.0
32,944 (01.70%)	216 (00.14%)	375.7 MiB (01.21%)	MJ12bot/v1.4.8
28,577 (01.48%)	3,695 (02.48%)	313 MiB (01.01%)	ClaudeBot/1.0
3,953 (00.20%)	967 (00.65%)	297.4 MiB (00.96%)	Bytespider
13,919 (00.72%)	943 (00.63%)	202.8 MiB (00.65%)	Googlebot/2.1
22,576 (01.17%)	13 (00.01%)	170.3 MiB (00.55%)	Scrapy/2.11.2

排最前面的几位就是 GPTBot, GoogleOther, A12Bot-dolma，之流。都属于人工智能派出来的网络蜘蛛，来各个网站抓取内容，而它们抓取的内容会怎样使用的，会给你的网站带来访客吗？

基本上是不会的，本质上，这些机器人会抓取你的内容，然后进行索引，对其重组织后，来产生人工智能所编写的内容。

这意味着任何用 ChatGPT 之类的智能工具所攥写的内容都是在剽窃你我的内容。

作为内容的创造者，你会愿意无偿提供内容给他们吗？

来看看 OpenAI 的 GPTBot 干了什么吧？

网站的站长允许 GPTBot 来抓取网站内容，就意味着允许 OpenAI：

使用你的内容来训练人工智能模型
使用你的网站信息来生成 AI 内容
增加了额外的服务器负担，影响普通访客访问网站的效果

作为内容的创造者，我对滥用 AI 的能力，无偿使用原创者的作品，十分担忧，也很反对。

目前我采用了 robots.txt 来封锁 GPTBot 和其它的一些人工智能 robot。

如果还有新出来的人工智能机器人，我不介意把他们加上去，在没有合理的使用原创内容方法之前，还是都封掉为好。

推荐本站淘宝优惠价购买喜欢的宝贝:

本文链接：https://hqyman.cn/post/9820.html 非本站原创文章欢迎转载，原创文章需保留本站地址！

分享到：

休息一下~~

作者:hqy | 分类:SEO | 浏览:162 | 评论:0

« 上一篇下一篇 »

发表评论:

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。

« 2025年6月 »
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

本站推荐小工具: MSDN ISO 磁力地址版本1

MSDN ISO 磁力地址版本2

Windows系统下载仓储站

微软原版软件官方镜像下载列表

Windows kms激活

Office kms激活

VMware ESXi8.0 补丁免费下载

Vmpatch镜像站

领淘宝优惠券

在线小工具

BING精品壁纸图片

360精品4K壁纸图片，每日词霸

Today今日热点

Unlock Music 音乐解锁 (React)

在线查IP |WhatIsMyIPAddress

在线下载测速

百家姓暗号

在线fc小游戏

圈住猫的游戏

2048的游戏

找色差小游戏

今天吃什么呢

毒鸡汤网页

每日笑话精选

在线查QQ价值

html在线编辑预览器

在线it-tools工具箱

在线it-tools工具箱(备站)

微软密钥在线检测

在线WinXP虚拟机

whois在线查询

开发者资源的宝库

Linux工具箱一键脚本

Linux工具箱

城通网盘

宝塔服务器面板

阿里云特价VPS服务器

腾讯云特价VPS服务器

华为云特价VPS服务器

京东云特价VPS服务器

cloudcone特价VPS服务器

racknerd特价VPS服务器

恒创VPS特价服务器

简云免费虚拟云主机

PrivacyPolicy

控制面板: 您好，欢迎到访网站！
登录后台查看权限
个人中心修改密码

随心随性: 沧海月明珠有泪，蓝田日暖玉生烟。

网站分类

搜索

最新留言

文章归档

网站收藏

一个和谐有爱的空间

友情链接

请先登录再评论，若不是会员请先注册！

您的IP地址是: