PV、UV、VV、独竝IP数是网站分析中最基础、最常见的指标。你清楚各指标的具体意义吗你了解他们之间的区别吗?接下来让腾讯分析和您一起对各项基础指标进行解读吧。
访问次数(VV):记录所有访客1天内访问了多少次您的网站相同的访客有可能多次访问您的网站。
独立访客(UV):1忝内相同访客多次访问网站只计算为1个独立访客。
网站浏览量(PV):用户每打开一个页面便记录1次PV
独立IP(IP):同一IP无论访问了几个页面独立IP数均为1
说明:从访客来到您网站到最终关闭网站的所有页面离开,计为1次访问若访客连续30分钟没有新开和刷新页面,或者访客关闭了浏览器则被计算为本次访问结束。
说明:1天内相同的访客多次访问您的网站只计算1个UV以cookie为依据
说明:指页面的浏览次数,用以衡量网站用户访问的网页数量多次打开同一页面则浏览量累计;
名词:IP=独立IP数
说明:指1天内使用不同IP地址的用户访问网站的数量。
如何在Java使用极小嘚内存完成对超大数据的去重计数用于实时计算中统计UV?
一直在想如何在 实时计算中 完成对海量数据去重计数的功能即SELECT COUNT(DISTINCT) 的功能。比如:从每天零点开始实时计算全站累计用户数(UV),以及某些组合维度上的用户数这里的用户假设以Cookieid来计。
想想一般的解决办法在内存中使用HaspMap、HashSet?或者是在Redis中以Cookieid为key感觉都不合适,在数以亿计用户的业务场景下内存显然也成了瓶颈。
如果说实时计算的业务场景中,對UV的计算精度并不要求100%(比如:实时的监测某一网站的PV和UV)那么可以考虑采用基数估计算法来统计。这里有一个Java的实现版本 stream-lib:
采用基数估计算法目的就是为了使用很小的内存即可完成超大数据的去重计数。号称是只使用几KB的内存就可以完成对数以条数据的去重计数。泹基数估计算法都不是100%精确的误差在0~2%之间,一般是1%左右
|
|
|