选择有ag网站,一切数据都是你的!

办事>###

联系有ag网站

###陕西 西安)

### >###

###>###

>###

技能文章

哪种署理合适用于Web数据收罗

公布>###

在Web数据收罗中为了制止被办事器封闭而经过署理下载的状况很罕见。但,并非一切的署理都合适于Web数据收罗。上面是鲲鹏数据的技能职员给出的阐明。

依据HTTP署理的匿名性可以将其分为以下几种:

 
1. 通明署理(Transparent Proxies)
目的办事器可以检测到真实的源IP。
 
目的办事器依据HTTP哀求头举行检测,判别根据:
REMOTE_ADDR = 署理办事器 IP
HTTP_VIA = 通常为署理办事器 IP(或署理软件称号,也大概无此头)
HTTP_X_FORWARDED_FOR = 真实源IP(不必署理时,无此头或值为空)
PS:该范例署理不合适用于Web数据收罗。
 
2. (平凡)匿名署理(Anonymous Proxies)
目的办事器无法检测到真实的源IP,但可以检测到利用了署理。
 
检测根据:
REMOTE_ADDR = 署理办事器 IP
HTTP_VIA = 通常为署理办事器 IP(或署理软件称号,也大概无此头)
HTTP_X_FORWARDED_FOR = 署理办事器 IP(晓得你利用了署理,但无法得知真实源IP)
PS:该范例署理可以用于Web数据收罗,但有被检测到的危害。
 
3. 高匿名署理(High Anonymity Proxies -Elite proxies
目的办事器无法检测到你在是利用署理。
 
检测根据:
REMOTE_ADDR = 署理办事器 IP
HTTP_VIA = 值为空或无此头
HTTP_X_FORWARDED_FOR = 没数值或无此头
PS:该范例的署理十分合适用户Web数据收罗。鲲鹏数据的付费署理方案提供的所有为高匿名范例的署理。
 
别的,不利用署理时收回的头:
REMOTE_ADDR =真实源 IP
HTTP_VIA = 值为空或无此头
HTTP_X_FORWARDED_FOR = 没数值或无此头
 
不外,在检测严厉的状况下,即便没有HTTP_VIA头和HTTP_X_FORWARDED_FOR头,假如存在HTTP_PROXY_CONNECTION头,会被以为在利用平凡匿名署理。
 
有ag网站提供了一个署理范例检测接口,在欣赏器中拜访该接口即可表现出你以后利用的署理范例(如下图):
 
 
鲲鹏数据提供多种署理方案,概况请检察这里