电脑技术学习

怎样通过对比的方法判断一个统计系统是否存在漏统计

dn001

其实就是为了纠正一个错误的看法:IP少就是有漏统计。
正确的看法应该是:PV少才是有漏统计。

PV就是页面浏览,
很显然,
不论这些浏览行为的行为人是谁,只要页面被浏览,统计系统就应该统计到一次PV。
所以如果甲乙两个统计系统对同一个网站的统计,甲认为是10个PV,而乙认为是11个PV,
那么很显然甲漏掉了某一次页面被浏览的行为。

那么IP的区别如何是怎么回事呢?
现在先假设甲乙两个统计系统得到了相同的PV(如果有某个PV少,则一定是有漏的,那就不好对比了),
而甲统计到3个IP,而乙统计到2个IP,
这时候如果你认为是乙漏统计了一个IP的行为,
那么设想一下,乙漏掉的这个IP至少应该有一次浏览吧?如果乙漏掉了这个IP的行为,那么乙应该最多只能统计到9个PV而不是10个。
既然乙统计到了10个PV,说明乙并没有漏掉任何一次页面被访问的行为。

那么甲统计为什么比乙统计多统计到了一个IP呢?
其实可以这样理解,
同样是10个PV,甲认为是3个IP,其实就是10个PV中其实中7次甲认为是“已经来访过的IP的浏览行为”
而同样的道理,乙却是认为有8次都是“已经来访过的IP的浏览行为”,
那就是说,存在其中一次浏览行为,甲认为是一个新的IP的行为,而乙认为是一个曾经来访过的IP的行为,
这是什么原因呢,很显然是乙记忆的时间比较长。

比如,
我要啦记忆凌晨之后所有的IP的行为,只要某个IP凌晨之后访问过你的网站,则这个IP在第二天凌晨前的所有浏览行为都不会被认为是一个新的IP产生的行为,因为我要啦认为这个IP不是一个新的IP。
而一些别的统计系统记忆的时间没有这么长,一个IP在早上访问了你的网站之后,到晚上再来访问的时候,这个统计系统已经不知道这是一个早上曾经来访过的IP了,所以就将这次浏览行为认为是一个新的IP的浏览行为,从而为这一天多记了一个IP。

记录多长时间的IP用来区分是否是一个新的IP,不同的统计系统有不同的方法,所以才会有IP数据的不同。

我要啦认为IP这个数据主要用来回答“今天有多少个IP访问”的问题,所以我要啦认为不应当把一个IP在一天之内的多次行为记录为多个IP。如果同一个IP在早上访问和晚上访问被记为两个IP,则当你看到报表上的 2 IP 的时候,就无法知道这究竟是一个IP的早晚的两次访问,还是两个IP各自的访问。

所有的统计系统都可能存在漏统计现象,这是多个方面综合作用的结果,需要统计提供者和站长的共同努力加以避免。
怀疑一个统计系统存在漏统计的心情可以理解,但是用【IP少就是有漏统计】的【错误方法】进行简单的判断是不理智的,这容易让自己不了解IP量的真实情况。

标签:

留言评论

留言与评论(共有 0 条评论)
   
验证码: