内容不多,但我觉得有必要单独写一下。
这里访问量分析指的是google、cnzz这样的第三方访问分析服务或者自行安装piwik这样的程序,技术上界定的话,是插代码到网页中才能进行分析的服务、技术、程序等等。
我们浏览页面,不考虑dns这个过程的话,是客户端浏览器---web服务器/cdn/前端代理服务器等,而是否使用前端反代或者cdn,这个对于客户端来说是透明的,无区别。也就是说,用户的浏览器是与前端服务器进行数据传递的,也就是说,任何访问、下载这类的行为都必然经过服务器。
而第三方服务呢,代码产生在页面,也就是说最终是在客户端浏览器执行,通过js等技术可以实现页面所有信息的收集,这没错,但是不经由页面的数据传递行为就无法得知了,最简单的一个例子:盗链。如果用户的访问行为并不由网页发起,那么这样的流量行为是无法通过第三方得知的。
但两者也各有利弊,第三方服务的优点在于可以更多的收集客户端环境信息,比如屏幕分辨率,缺点也很明显,它无法反应“不太正常”的流量行为。
而服务器日志的优点是最忠实的反应服务器流量到底是怎么产生的,比如盗链,比如有人扫漏洞等等。缺点则是无法收集到很细致的客户端信息。