这是一篇回应短文,起因是就我的文章《破解myspace成功之谜》与网友cnsns进行的讨论。在cnsns的讨论文章《由麦田:深度剖析MySpace》中,首先牵涉到一个话题,即如何通过alexa的“百万人访问量”指标,来估算一个网站每日的独立IP。

cnsns网友在他的文章中给出了一个复杂的算法,但那是错的。首先,通过公开的alexa数据去测算网站一般保密的独立IP,只能是“估算”;其次,有一个简单的方法进行此估算:

全球网民大约3亿,所以把alexa“百万人访问量”×300,一般就是某网站的每日独立访问IP

这个估算方法,经过多次实际验证,对于大、中型网站(Top5000之内),一般比较靠谱。

就这么简单,呵呵。


8条评论

  1. 谢谢麦田

    我的回应是:

    1.我认同对于总IP访问量的估计有很大的错误,主要是在“alexa权重“上有太过于经验想,或者说拍脑子想,当时在我的那一段里也说明了这一点:急需拍砖”

    2.关于300值,这一点上看来要区分网站的规模与用户群。比如对于板儿砖上的ALEXA达到过60,那以这样来算每天独立IP是18000,这是不可能的.这样的估算与我定为7%权重的问题一样。

    另外期待你的10万值的说明,我想大家都期待

    不过没有关系,没有探讨是不会有东西出来的,再次感谢

  2. 学习了。谢了~~~:-)

  3. “百万人访问量”×300这个公式我一直用,根据经验,基本正确。有个小问题就是,全球3亿网民,每天都会上网吗?如果今天只有一半网民上网了,就应该乘150了。所以,用alexa估算出来的网站访问量,一般会稍微偏高一些。

  4. 另外一个问题:通常网站的uv一般指“独立ip”,而众所周知,alexa统计的是真正的用户数量。因为代理服务器的存在,一般网站的独立用户访问量一般要大于独立ip访问量。所以说,alexa的reach per million users直接乘以300,会高于一般网站的内部uv统计。我的经验是,要估算一个网站的ip访问量,用alexa reach乘以100更准确一些。这样麦田提出的10万ip的tipping point,反过来推就是1000的reach。这与myspace.com在2005年之前的alexa统计吻合。

  5. 10万ip成为临界点,有个的原因就是硬件的限制。除了下载类网站,一般网站达到了10万ip访问量后,占用的带宽就会接近或超过5mbps,这样一般的IDC中100兆共享的出口肯定是不行了,下一步升级到独享出口的成本是成几何指数上升的。另外,这个访问量也到了独立服务器能承受的极限,再往下发展就要增加服务器数量了。所以,对一些小网站来说,10万ip是发展道路上的一个坎,是个人网站向商业网站转变的里程碑。

  6. 这个算法太粗糙了,根本不考虑ALEXA的算法变化。比如04年国内站点普遍ALEXA访问数下滑,而事实上我们知道多数公司当时PV还是上涨的,这怎么解释?

    ALEXA能看出很多东西,但要根据自己的实践不断调整。最好是能接触更多公司的访问数据,所以业内内部交流是很重要的,尤其是大站之间很少有公开的交流,全是个人之间业余的爱好,与窥探的敏感。

  7. 但有很多人是不装Alexa的呀

    难道显示“Daily Reach per million users:”时

    Alexa已经把这个参数算到里面了?

  8. 我也计算过,按照美国一权威统计报告,去年美国每日搜索引擎使用的人数是5400万,按照48%的市场占有份额,她应该是2592万,而google的 alexa“百万人访问量”是30万左右,所以,大型网站,应该是“百万人访问量”*100左右。流量小的网站,应该在150-200左右。

发表评论

评论也有版权!