http代理是什么东西?在整个互联网的Web结构中,HTTP代理服务器是一个出现频率极高的组件(其他还有浏览器、缓存服务器、Web服务器、DNS解析服务器等),理解HTTP代理服务器的原理有助于我们更好地认识Web架构。
有些公司需要限制某些网站不能被员工访问,那么就可以在代理服务器上添加策略:当检测到有员工访问该网站时直接提示;
公司出于安全的考虑,避免员工访问的网站带入病毒,因为所有请求和响应都会经过代理,所以就可以在代理上做病毒检测;
假设员工A和员工B都想访问http://www.bianjijingling.com/test.html,那代理服务器可以缓存test.html,这样员工A和B的两个请求可以缩减为一个,降低了网络带宽的开销;
总而言之,代理服务器是一个口子,有了这个口子,我们就可以在这个口子上做任何事情。
反向代理服务器
在代理服务器的基础上,又逐渐衍生出代理反向代理服务器
最原始的代理服务器的代理是指充当客户端的“代理”,那如上图所示的代理则是Web服务器的代理,因此我们给其取名为反向代理服务器。(反向的含义是以前代理客户端,现在代理服务端)
反向代理服务器对外屏蔽了真实的服务器,并且作为服务端的出入口,我们可以在反向代理服务器上添加策略:比如Web攻击防护策略、CC攻击防护策略等。
http代理的应用非常广泛,http代理主要应用于浏览器层面,主要应用于爬虫数据采集,舆情监测、补量、APP排名,seo优化当中。【推荐阅读:简述http代理和socks代理的不同】