12月 22, 2012

很多年前,各种传闻都在传 2012年的12月21日是世界末日,太阳将不会在第二天升起来。而当这一天真的到来时,绝大多数的人反而都在很淡定的做着与平时一样的事情。今日驱车前往香山的路上,广播里一直在播放的也是各种世界末日的传闻和辟谣。

三德同时也注意到了新浪微博上两个有意思的东东:

1. 使用网页版的新浪微博 发送出来的微博,在“微博尾巴”——来源处会显示“玛雅人的微博”,而不再是 新浪微博 四个字,但链接地址却没有变化,仍然是 weibo.com 的网址。
类似情况的运营手段曾经在苹果公司ceo乔布斯 去世时使用过,当时是将所有来自“iphone客户端” 来源的微博,都改成了来自“乔布斯的iphone”,当时这一改进曾经获得诸多网友的认可和好评。
但这一次改的效果则明显不如上次那么引人注目,更感觉是一种戏谑的体味在里面。

2. 同时,今天新浪微博上的“联合国” 也卖萌:[严正声明]联合国真心木有发放过任何船票。。 [右哼哼]随时受不了!哼![哼]
原微博地址见:http://e.weibo.com/1709157165/zaKdtlalJ

可能是由于最近各种印有”联合国“ 标志的2012船票和各种末日“宣传品”泛滥的影响,联合国也忍不住了吧。因为谁也不想自己的“商标”变成像adidas 一样,经常被印刷在各种不知名的布料和衣服上。

原文地址:http://blog.didu.me/article/508

Tags: ,,,.
12月 4, 2012

上月底本月初,360浏览器通过各家媒体和在线网站高调宣布支持“禁止跟踪”,并宣称是“继微软之后,全球第二家宣布支持DNT功能的浏览器”。

首先,到底什么是“禁止跟踪”呢?

禁止跟踪 英文简称DNT(Do Not Track),其目的是禁止网站跟踪和收集用户在多个网站上的行为和操作数据等。而根据当前主流互联网所使用的HTTP1.1 技术协议中并没有对此内容的声明,而目前的参考标准则是由互联网标准化组织W3C在今年10月份推出的一份标准草案。根据此标准草案,当用户不希望网站跟踪自己的行为时,网站应该停止跟踪用户。而当前在操作层面,这只是一种君子协定,也就是说用户可以通过浏览器告诉网站不要跟踪自己,但是网站是否服从该协定则要看网站是否够“君子”或者认可此君子协定。

为什么要跟踪用户?

通过跟踪用户在某网站的不同访问行为,甚至是在其它网站的访问行为,可以更好的发现用户的兴趣和喜好,也有助于查找互联网产品的缺点和弊病。通过对用户行为的分析,可以将分析结果用于对网站产品进行优化和改进,同时也可以具有针对性的推送更符合用户偏好的内容或广告。

典型的应用比如:用户在一段时间内频繁使用google搜索“汽车”,则当访问投放了google 广告的其他任何网站时,将有可能出现“汽车”相关的广告。

一般情况下什么网站会跟踪用户的行为呢?

在微软宣布新版本的IE10 将默认开启“禁止跟踪”功能后,业界均认为此行为剑指其竞争对手google。根据国外公布的数据,google 作为全球最大的搜索引擎服务提供商,2011年其在全球网络在线广告市场占有率超过44%之多,全球有数以百万级的网站使用google 的广告系统进行广告展示和在线投放。

而在线广告的效果一般通过曝光率、点击率、行为转化率等参数进行体现。在网站上展示的广告与浏览网站的用户兴趣喜好越是贴近,当然广告的效果也就越好。

因此大多数的广告联盟和搜索引擎都会对用户的行为进行一定的跟踪,因此可以猜测国内的百度等搜索引擎网站也应该具有类似系统。

除了搜索引擎和广告联盟,很多大型互联网网站、第三方的统计分析网站也都具有用户行为的跟踪和分析能力,其分析结果大多用户产品优化和内容推荐。

跟踪用户行为有哪些优点和缺点?

其实跟踪用户行为并不是一无是处,从客观角度来说,若用户行为数据跟踪、分析和利用合理:是非常有助于普通网民提高浏览网络的体验的,因为用户看到的都是自己喜欢和感兴趣的内容,感觉网站更了解用户;同时也利于互联网网站不断分析和优化自己的产品,从数据角度找出有待提高的方面。而相反的方向,用户数据利用不当则会导致隐私泄露、甚至机密数据泄露等问题发生。

随着近年用户隐私不断被重视,我们经常可以看到类似新闻:Google被FTC罚款2250万美元 因违反隐私保护(原文:http://tech.hexun.com/2012-08-10/144604542.html )。

看360浏览器和“禁止追踪”的关系和趋势:

上图是“google 趋势”中关于“DNT” 的中文网页趋势。
可能有朋友会怀疑如此一个英文简称DNT(“禁止追踪” 的英文简称)在google中的趋势是否具有代表性,下面我们再来看下360浏览器营销的重要阵营之一——新浪微博 的相关指数:
从上图的“新浪微博指数” http://data.weibo.com/index 可以看到,在于google趋势图几乎相同周期点上——也就是2012年11月底左右,新浪微博上关于“360浏览器” 关键词的微博数量呈现剧烈的上升。
我们推测这两个趋势具有一定的相关性,而这也正是360浏览器的一系列宣传效果的体现。
一起猜下360浏览器下一步会做什么?
本着中立和客观的态度,在此笔者刘三德不想评价一家公司的好恶。只是猜测360浏览器在高调宣传其已经支持“禁止跟踪” 功能后,将可能适时利用此功能对与其有竞争关系的百度、搜狗等公司采取措施(360已经推出自主搜索so.com,因此与现有搜索引擎公司出现了竞争关系)——替用户禁止这些网站跟踪其行为。
但是“禁止跟踪” 只是一个君子协定,如果这些网站不认可和遵守该协议怎么办?而我国在保护互联网用户隐私方面的法律和制度又不甚健全。从以往的作风来看,360较善于“教育”或“灌输”给用户特定的价值观。这个君子协定将可能变成一跟道德的大棒被高高举起,砸向那些“不道德”的人,谁又敢承担冒犯所有互联网用户的名声和风险呢?别忘了,360浏览器的装机量可以号称几个亿!
有消息称360自己也做广告联盟了,就不怕这样弄下来自己也影响了自己吗?关于这个杞人忧天的话题,在此不做详细讨论。
后“禁止跟踪”功能时代?
其实当前国外某些国家和互联网巨头以及国际标准组织已经在进行相关制度和规范的制定和试行,如果有一天浏览器的“禁止跟踪” 功能涉及隐私的问题被规范化,那么用户在访问某些网站时应该有权利决定自己是否被追踪,自主选择权本应该在用户手里!
届时对于不遵守“禁止追踪”君子协定的互联网网站,更多的应该是靠道德谴责和法制的健全来管控,而不是通过其它不君子的方式和技术和措施来处理。也希望在将来,用户的行为能得到适当的合理的应用。
原文地址:http://blog.didu.me/article/502
Tags: ,,,,,.
06月 10, 2012

写在前面的话,笔者最近一直想写一写关于大数据的博客与大家讨论,但是大数据本身并不是笔者刘三德关注的主要方向,因此一直唯恐写得太浅或太局限而缺乏价值。最近看了谢文老师的一篇“聚沙成塔 集腋成裘——四谈大数据时代”文章,通读全文以后笔者认为其文学价值要大于实用价值,因此笔者对于谢文老师的文采还是比较赞赏的。当然,若此文放在三四年前的互联网,也较能彰显其价值。但是对于今日的互联网和移动互联网,大数据的规模和应用深度早已不次于传统的电信、民航等行业,甚至超过不少。因此笔者还是想写些东西浅谈一下互联网的大数据应用,权当抛砖引玉,也希望更多的朋友参与交流和讨论。

近日,又看到一则新闻,文中来自国外同行的分析观点,称“互联网大数据蕴藏的财富堪比石油”。可能有些朋友会感觉有些夸大,笔者一度也是如此认为。但后来转念一想,就像在前文提到的,苹果的app store通过用户的下载等行为,可能做到比用户自身还要了解其客观喜好一样。每一个个体的人有的时候,不一定那么了解自己,上升到社会层次,在一个范围内的人类群体,有些时候也不一定那么了解自身。而通过分析很多用户的行为以及因应效果,应该是可以做到某些方面的趋势预测的。关于预测,笔者刘三德计划在接下来的文章中再去讨论,本文主要从互联网大数据分析的重点——“用户行为分析”入手简单谈一下认识。

在很多前辈和业内朋友的文章中,谈到互联网大数据,其实很多的都是提到了用户行为这个最典型的数据系统。目前众多的大数据来源中最为重要也最有价值的两类应属于:“行为”与“内容”——基于用户身份系统之上产生的两类数据(关于互联网用户身份系统请参考之前的一篇讨论:互联网大数据应用之一:用户资料系统——刘三德)。

由于互联网用户行为比较多种多样,而且在不同功能、不同体验的产品上也有很大不同,因此,要以一篇文章概述所有的用户行为构成还是很难的,而且由于关注产品和范围有限,笔者也很难总结全面所有的互联网用户行为构成和其特性。但本着少谈大方向和大趋势多谈实际应用的想法,仍然希望本文能够从一些简单的,具有共性和通用性的典型互联网用户行为入手做一些讨论。

目前,互联网用户的主要接入媒介分为:PC 和手机、智能平板等移动和不可移动终端。而用户行为的产生方式和载体来源一般包括以下几点:

1. 眼球,眼动行为。基于此种用户行为的分析在国外还是比较流行的,老外对于用户的研究可以说更加先进和倾向于极致。目前在国内的很多领域也有类似用户研究的应用,感兴趣的朋友可以去搜下。通过研究用户的眼球移动和停留等,产品设计师可以更容易了解界面上哪些元素更受用户关注,哪些元素设计得合理或不合理等。此外,通过优化多个用户操作界面也可以相应的优化用户操作体验流程。

2.鼠标,点击和移动行为。从鼠标诞生之后,互联网上最多的用户行为应该都是通过鼠标来完成的,因此,分析用户行为时分析鼠标是必须要分析的。除了鼠标点击行为以外,鼠标的移动轨迹也可以被记录和分析。目前国内外很多大公司都有自己的系统,用于记录和统计不同程度上的用户鼠标行为。此外,据了解,目前国内的很多第三方统计网站也可以为中小网站和企业提供鼠标移动轨迹等记录。

3.键盘等其它设备的输入行为。此类设备主要是为了满足鼠标不能通过简单点击等进行的如大量内容输入等场景。键盘的输入行为不是用户行为分析的重点,但键盘产生的内容确是大数据应用中内容分析的重点。

4.其它终端的触摸和点击等行为。此类设备目前主要是作为鼠标和键盘的替代品,在大多产品中都是如此。但新兴的多点触控等技术将能够产生更加复杂的用户行为,在某些特定产品中,也有必要对此类行为进行记录和分析的。

基于以上媒介,用户在不同的产品上可以产生千奇百怪,形形色色的行为。我们就可以通过对这些行为的记录和分析更好的在产品设计、产品运营、产品市场与盈利、用户体验、用户需求等互联网产品的关键点之间进行权衡。

对于用户产生的行为,笔者刘三德认为可以从两个大方向分:消费行为、贡献行为。从技术层面上讲,前者主要是输出——数据下行,后者主要是输入——数据上行。虽然实际应用中,并不是如此简单,有很多时候我们可以看到用户的消费和贡献行为并不是那么清晰可分的,有的时候用户的消费行为本身就是一种贡献!所以,在总结用户的贡献行为时,除了用户的直接贡献行为以外,将另一类贡献行为称之为——群体和持续性消费行为而产生的贡献行为

图:互联网用户行为简析(作者:刘三德)

还是之前那个观点,互联网的大数据不是一定要复杂才可以称作大数据。在一维的层次来看,都是直接数据,而且大多都是最简单的数据记录集合。在上图中,试着将互联网典型的用户行为进行了一定的分类和归纳,必定也不够全面,而且图中标出的用户行为也基本都是一维的直接用户行为。但是通过对这些数据进行不同方法的建模和推导分析,则可以得出千变万化的数据结果——这才是真正的互联网大数据应用。

那么基于用户行为分析,我们可以做什么?——这是核心问题,也就是我们做大数据分析的目的,为了什么?

其实,如果一直在参与互联网产品生产流程的业内朋友必然都了解,互联网产品生产的大致流程和一些关键的部门构成:产品部门、技术部门、运营部门、市场部门、此外还有一个大部门叫做BOSS(老板的决策层)。其中产品和技术部门是主要的产品生产部门,运营和市场部门则是将产品进行推广和盈利的部门。而这些部门构成的生产流程中又会有很多关键的细节,其中每一个点如果都有量化数据的支持,无疑将对决策产生很大的指导和斧正作用。我们试着从其中挑选几个步骤和应用场景简要举例:

1. 产品设计与营销。产品经理和设计师不是万能的,也不一定都是人中的人精——乔布斯只诞生了一个。要做好的产品设计,就要不断的听取用户意见,不断的调研用户需求并进行分析,得到最适合和满足用户需求和产品特性。除了直接的用户调研,数据分析得到的结果支持是很重要的一个渠道。因为有的时候,用户也不知道他到底想要什么,但是从用户的行为中,我们或许可以分析出来他不了解的自己。比如通过对微博用户分析,得知用户在每天的四个时间点:早起去上班的路上、午饭时间、晚饭时间、睡觉前 是最活跃的。因此,掌握了这些用户行为,企业就可以在对应的时间段做某些针对性的推广和营销等。

2. 产品客户群定位或细分。并不是所有的产品都是服务于全网用户的,即使对于细分产品,也是有更细致和精确的用户特性可以供提炼分析。除了前文用户资料系统之外,用户行为是更重要的一个分析手段。比如对于电商网站,通过对用户的消费行为和贡献行为产生的数据进行分析,可以量化很多指标服务于各个生产和营销环节。比如我们常说的:转化率、客单价、购买频率、平均毛利率、用户满意度等一系列量化的指标。

3. 商业分析与盈利模式调整。目前比较流行的一个词是商业智能,在大家通常所提及的商业智能应用中,最重要的一个数据来源就是用户行为。由于商业智能本身是一个很大的话题,本文不再细致讨论,目前商业智能的应用在国内的互联网领域已有不少应用,很多应用在大公司和消费类产品平台上。

4. 推荐系统。这是一个存在一些争议的话题,有人看好有人唱衰。据笔者刘三德了解,商业智能中很重要的一个应用案例就是推荐系统。后续有时间的话,愿意和感兴趣的朋友一起讨论下推荐系统相关。

最近几年,互联网的产品呈现出一轮爆发性发展态势。尤其是移动终端的普及,使得很多传统的互联网产品也开始移动化。但截止目前来看,笔者认为产品载体的丰富对于很多传统的互联网产品来说,并没有带来质的改变,移动终端的产品大多是互联网已有形态的延伸。也就是说移动互联网的很多产品在用户行为的统计和利用上,仍与传统的互联网区别不大——从这个角度来说,我们没有落伍。

Tags: ,,.
06月 1, 2012
文/Donews博客作家 刘三德

写在前面的话,笔者最近一直想写一写关于大数据的博客与大家讨论,但是大数据本身并不是笔者刘三德关注的主要方向,因此一直唯恐写得太浅或太局限而缺乏价值。最近看了谢文老师的一篇“聚沙成塔 集腋成裘——四谈大数据时代”文章,通读全文以后笔者对于谢文老师的文采还是比较赞赏的。当然,若此文放在三四年前的互联网,也较能彰显其价值。但是对于今日的互联网和移动互联网,大数据的规模和应用深度早已不次于传统的电信、民航等行业,甚至超过不少。因此笔者还是想写些东西浅谈一下互联网的大数据应用,权当抛砖引玉,也希望更多的朋友参与交流和讨论。

首先,第一篇想谈一下互联网的用户系统。无论互联网还是移动互联网,本身具有很大的特性就是互联,所以我们都可以称之为互联网,或者说移动互联网是互联网的一个子集和延伸。
在传统的电信、民航、能源等行业,企业的客户和主体用户构成都是有身份ID的。比如电信行业中身份证登记的手机卡号,比如民航用户乘坐航班登机的身份证或护照信息等,这些信息可以作为基本的用户身份ID,便于企业对其用户、客户进行身份辨别,并对后续的用户行为进行跟踪和分析。传统企业所存储的用户信息的很大优势在于完整性,很多先天的比如姓名、性别、年龄甚至籍贯等真实的基础身份信息都可以简单获得。而在互联网上,用户的访问都是匿名的,即使用户在接入互联网的时候使用的登记信息是实名的,但那主要是提供给电信服务商和公共安全机构备案而用。普通的互联网网站在用户面前是完全透明的被“围观”的,这个状况在web1.0 的主要产品——门户网站中最为典型。到了web2.0 时代,互联网开始变得互动起来,用户从简单的匿名浏览,变成了可以通过注册身份参与信息的制造和流通。这个时候,诞生了这个时代在谈的互联网大数据应用中非常重要的一个非决定性条件——用户身份系统。为什么说是“非决定性条件”呢?因为,在这之前,大量的数据分析也是可以做的,但是由于对用户缺乏身份缺乏甄别,因此数据分析能够应用的场景和得到的数据都相对很有限,但并不代表不能做大数据分析。而web2.0 的用户身份系统诞生,则使互联网某种程度上具有了和传统行业同样的用户身份记录系统,数据统计和分析都可以更精准和深入。其中,以腾讯QQ、新浪UC等PC桌面产品为代表的互联网早期产品,应该是建立了互联网更早的用户身份系统,我们也可以看到这些系统在其后续的web产品铺开时同样被继承了过来。

那么,互联网的用户身份系统,一般都具有哪些信息呢?
打开任何一个网站,我们都可以看到注册页面需要填写用户名/email,性别,年龄 等基本信息。当然,不同的网站和互联网产品有不同的用户资料细化的程度。拿现在比较流行的几款产品做比较,其他互联网产品大多类似:1. 新浪微博中用户可以填写自己的昵称、头像、真实姓名、所在地、性别、生日、博客地址、email、QQ/MSN、自我介绍、用户标签、教育信息、职业信息……;2.腾讯QQ客户端上可以填写头像、昵称、个性签名、姓名、性别、英文名、生日、血型、生肖、故乡、所在地、邮编、电话、学历、职业、语言、手机……

看起来还真不少,那么网站要用户的这些信息会被干嘛用呢?
这里笔者刘三德认为主要有以下几点:1. 展示自我;2.作为唯一的身份ID用作用户身份区别;3.搜索和推荐相关;4.网站自身可以做用户分析和用户行为跟踪。展现自我放到第一位是因为这是从产品满足用户需求的角度决定的,用户资料的首要任务就是为了作为用户唯一的可识别身份标识展示自我。其次,搜索和推荐相关这一点笔者刘三德计划在后续用专门的篇章来写,此处简单理解即可。最后一点,也就是本文所关注的一点,就是用用户身份来做数据分析。涉及到的用户分析主要维度为用户资料和用户行为。同样,用户行为也计划在后续篇章专门来写,本文着重讨论一下用户资料的分析。

可能行业内的一些文章和老前辈的观点,数据首先要量大、其次要有高的复杂度,才可以称为大数据。但笔者认为,大数据在一维的层次上不一定具有很强的复杂度,大部分是由最简单的数据形式构成。就譬如用户资料,一个网站如果有一千万的注册用户,如果每个用户的资料具有6个有效字段,就是6000万的有效数据。而将这6000万的有效数据通过一层或者几层简单的统计叠加分析、交叉分析等,在计算上本身就具有了不小的复杂度。何况现今的互联网产品,尤其社交类产品如FACEBOOK,腾讯QQ、新浪微博等动辄上亿的注册用户,本身用户系统就是一个非常具有价值的大数据。
通过分析用户系统可以得到什么呢?
当然,用户填写的注册资料中包含的资料,都是最基础的分析数据。还是用数据说话,如下图:

以上图片来自互联网

以上数据是第三方机构公布的,而且都是最简单的一维数据,我们可以看到很多家网站的用户资料对比(上面引用的部分数据来源也可为线上调查问卷等形式)。对于独立的一个网站来说,用户资料的分析当然只是局限在自己的网站范围之内。进入互联网web2.0 时代以后,大家都开始更加重视用户和用户体验,对于网站自身用户的特征进行分析,可以更好的网站的用户特性分布,方便针对网站的用户群特点更有针对性的进行对应的产品设计和研发。比如通过了解用户的消费层次等,也可以更好的提供用户消费相关展示和服务。

那么,无用户身份信息的互联网是否不再大数据?——不用注册的用户身份系统的。
可能有的朋友会对这个话题存疑问,也可能有的朋友会惊恐,认为隐私泄露了,其实这里的应用也非常简单。在类似传统的web1.0 门户类以展示为主的互联网产品中,也是可以做数据的分析和挖掘的,而且也有比较成熟的方案。是否有朋友曾经经历过以下场景:在百度上搜索汽车、查了半天汽车资料,一个小时以后再随手打开的一个图书阅读网站上居然出现了“汽车广告”。其实,即使我们没有在这些网站上注册,百度等搜索引擎本身还是可以为用户标识一个唯一的身份信息,虽然这个身份信息只是临时的,可能有效期也只有几天左右。但是,这依然是一种唯一的用户身份,只不过是记录的信息有限而已,但是仍然为用户行为分析提供了很大的帮助。感兴趣的朋友可以搜索“google adsense隐私政策” 进行相关了解,此处不在赘述。
用户资料系统方便了一系列的大数据挖掘
除了传统的互联网桌面端和web端产品,最近几年突飞猛进的移动互联网以及终端应用,基本也都有完备的用户信息系统。apple苹果公司做了app store,迄今为止的应用下载次数突破250亿次,而每一次的下载都需要使用唯一的用户ID,通过分析,苹果可能比你父母更加了解你想要什么——这属于用户行为分析范畴,后续将专门讨论。

总之,用户身份和资料的分析是互联网大数据分析中最基础的分析,用户身份系统在互联网的大数据时代,为后续的用户行为分析和对应的企业产品、服务设计提供了基石,也为更加深入的数据挖掘奠定了基础。

敬请阅读后续关于互联网大数据应用的其他分析,也期待对大数据有兴趣的朋友拍砖,一起讨论交流。

转载请注明 Donews博客认证作家/刘三德

Tags: ,,,,.
05月 25, 2012

文/Donews博客作家 刘三德转载请注明出处

写本文时并没有确定的思路去总结,只是在检索相关关键词的时候看到的现象所想到的,简单分析一下在现今网络中对于内容趋势的统计表现方面,微博与传统搜索引擎的差异对比。

本来想写一篇关于大数据相关的博文,于是就比较想关注这个关键词“大数据” 最近的受关注度趋势变化。首先想到的是去google trends 了当然,笔者刘三德打开了google trends并检索大数据,发现变化曲线如下图:


上图:“google趋势”搜索“大数据”

如果是经常关注技术趋势和社区动态的朋友可能会有感觉,最近关于“大数据” 的内容和报道非常多。从上面的将近12个月周期跨度图中可以看到确实,关于这个关键词的变化趋势,在今年2012年4月以来呈现了明显的上升趋势,目前的上升点已经到达了前所未有的一个高度。如此看起来google 的数据输出还是相对靠谱些的。也符合了笔者的心理预期。
紧接着又想起了百度指数,国产化的百度现在在国内搜索市场的占有率可是在80% 以上啊——多么可怕的数字。笔者打开百度指数页面 index.baidu.com 输入“大数据” 进行检索,结果“度娘”婉约了一把,给人来了个“犹抱琵琶半遮面”——被拒绝了?但百度确实提示说没有任何关于此关键词的质数信息,如下图所示:

上图:百度指数 页面搜索“大数据”

是百度指数有问题没有统计该关键词,还是之前笔者刘三德关注的内容面过于狭隘呢?抱着怀疑的态度,凝思了片刻后笔者决定去微博上一看究竟。首先打开新浪微博,非常令人happy 的事情就是新浪微博在前几个月就推出了“微博指数”,不过是很低调推出的而已。闲言少叙,进入新浪网微博的指数页面,输入“大数据”关键词,选择周期为半年之后,得到趋势结果如下图:

上图:新浪微博“微指数” 搜索“大数据” 得到的趋势图

从上图来看,趋势结果非常满足笔者之前的心理预期,而且我们可以用新浪微博这张指数趋势图和google trends 的趋势图做一下对比,可以发现在相同的周期内,二者的趋势图还是大体一致的。
好吧,既然百度的度娘没有给出笔者这个关键词的搜索结果,下文中暂且就以google 的数据趋势用作分析基础。

之前笔者曾经写过一篇博文是关于新浪微博试水网页搜索的,详见“新浪微博试水网页搜索,对比传统搜索有优势——作者:刘三德”一文。文中在结论部分第一点分析到“微博中具有来自互联网的高质量内容”,也就是说用户在传统网络中看到的可能是质量高的和质量低的内容都有,但是在微博中转发的和关注的一般都是其感兴趣或者比较有认同感的高质量内容。在这个观点下,则可以认为以上的几张统计趋势图中来自新浪微博的趋势图更精准一些——当然,前提是新浪微博的技术统计得靠谱。
而google 的趋势图,也具有类似的表现,应该能够说明传统的搜索引擎在基于网页质量的索引和统计上依然占有很大优势。在此不得不提google 的 page rank 体系,很多做SEO/SEM 的朋友对此自然十分熟悉。虽然google 后来宣称不再以page rank 值作为衡量网站内容质量的唯一标准,但google 对于网页质量的评判必然还是非常高效用的。关于以上搜索指数的数据来源,新浪微博的关键词指数来源应该比较单一的——来自自身微博系统中的内容,数据量相对有限。而传统的搜索引擎中索引的关键词的来源则是不定向的,基本可以说是来自互联网的任何角落。google 做的是在海量内容中进行索引、排重、排序,因此从这个角度上来说,搜索引擎在关键词指数上做的工作要比微博多得多得多。而在新浪微博的指数中,是否也有排重的机制存在?这点笔者还是持谨慎态度的,原因呢?接着往下分析。

毕竟“大数据” 属于科技类小众词汇,在某种程度上的被关注度还是有限的,那么笔者决定拿一个全网被关注度和SEO 优化度相对较高的词来查询一下结果,这个词就选“女装”吧。得到结果如下:


上图为“女装” 关键词在google trends 中的检索趋势图

上图为“女装” 关键词在新浪微博“微指数”中的检索趋势图

很明显,两者的趋势图差别极大。在传统搜索引擎google 中,数据曲线相对平滑:在2011年12月底曲线到达波峰、于2012年2月份到达波谷——而此时新浪微博的数据曲线趋于直线水平,没有变化;之后google 的曲线稳步上升持续到4月份左右,而同区间的新浪微博指数则在3月份几乎直线上升从 10,281 – 2,418,032 ,然后又直线跌落会原值——200多倍的曲线变化。

这也是上文中笔者为什么保持了谨慎态度的原因,初步猜测,新浪微博的指数趋势中没有对内容做排重,只是简单的统计和展示。不过笔者认为这种不排重的展示除了缺点,也有其优点。毕竟产品的特性相差也太大。

还是简单罗列一些分析点如下:

1. 传统搜索引擎的趋势图依然是更具有代表性,更典型,可以作为长效观察和了解关键词在全网中的趋势。

2. 微博作为快消品”,内容和趋势波动极易达到剧烈的程度。这本身和其产品定位,用户“消费”模式密不可分。而且微博从诞生之初,每每受到最多关注的时期都是“事件”时期,新浪微博也是很强的运用了事件驱动(event drive)的运营策略,因此极易导致某种内容和舆论在短时间内出现“井喷”。因此,微博中的内容曲线,不做去重等处理,只是做简单的叠加展示恰好造成了它的优势——作为短期内的内容和舆论导向参考还是极具价值的。

3. 微博营销和微博指数趋势。长期以来有很多公司在做网络营销,虽然微博是新生事物,但微博营销应该属于网络营销的一部分。而我们注意到,已经有很多新的专门做微博营销的公司成立,这证明微博作为新生媒体产品其自身的产品特点仍然没有健全。从最近一系列的各种微博恶意炒作、恶意营销(包括各种晒干爹、炫富、编故事骗取同情和关注)等还是可以看到一些表现的。在企业的微博营销中是否会有企业将某个营销关键词的微博指数作为营销的主要效果指数?很明显,简单的关键词指数在微博中的代表能力有限,就比如一个特定帐号对同一个关键词的200次提及,其影响力绝对不是提及1次的200倍!此时,缺乏排重和排名机制的微博指数就显得代表能力不足。微博营销不是本文的讨论范围,不再深入分析。

4. 关于企业、品牌微博影响力 或 微博营销的参考指数。目前看来,“微指数” 是不能完全指望了。就笔者刘三德的了解,业内已经有很多第三方公司开始或者尝试做这一领域,也就是之前文中提到的要检索的关键词“大数据”相关应用——目前比较火的概念之一。

5.搜索引擎提供短期内的指数是否更具代表性?我想这个问题要和微博的影响力到底有多大放到一起讨论。
笔者这里由于设置搜索周期的问题,所以我们看到的搜索引擎趋势都是长期的。其实google trends 和 百度指数 都是可以提供精确到“日”的指数,尤其以百度指数提供的趋势和相关性内容更丰富一些。
由于搜索引擎和微博代表性不同,这一点可以作为总结综合以上所有的点:搜索引擎依然可以作为代表全网数据的长效、短期数据的重要参考;微博目前提供的“微指数”具有短期的内容舆论或动向参考价值,但是从长期来讲,以及从可靠性来讲,相对还是很欠缺的。何况,创作140个字的一条微博相比创作一篇上千字的文章报道代价相差还是非常大的。

转载请注明 Donews博客认证作家/刘三德

Tags: ,,,,,.
05月 21, 2012
文/Donews博客作家 刘三德

近日,笔者在访问新浪微博搜索的时候,发现新浪微博已经在“微博搜索”结果中加入了网页搜索。而这种搜索结果只有对指定的部分用户开放,而并非所有用户都可以在微博搜索结果中看到对应关键词的网页搜索结果,也就是说新浪微博在小范围内进行“灰度测试”网页搜索结果。
如下图,在新浪微博的搜索网站 http://s.weibo.com/ 中输入搜索关键词“互联网”,搜索结果页面乍一看依旧是早期的布局——由关键词对应的微博和相关用户构成。搜索框下方是搜索条件筛选工具栏,可以指定筛选原创、认证用户、我关注的、图片、地区 等条件的搜索结果。
而继续向下拉,在微博的搜索结果之后就可以看到对应的网页搜索结果,而且其中也是对搜索的关键词进行了标红显示。每一条网页搜索结果后方都标有“网页”字样,对应的搜索结果呈现信息和要素有以下几点:
1.网页 title 标题
2.原网页地址
3.网页内容摘要
4.分享次数
5.分享时间
6.分享人
(阅读全文……)
Tags: ,,.

如题,笔者今日在“未登录”状态下访问新浪微博 weibo.com 网址,频频出现跳转错误问题。一直将笔者导向到北美新浪微博的网址 us.weibo.com 。但是在输入 www.weibo.com 访问的时候,则不会出现以上情况。

现将错误信息截图如下:

通过上图可以看到,在访问 http://weibo.com 时,http 响应的头信息中出现了重定向,将浏览器的访问地址重定向到了  http://us.weibo.com 下。

通过查看浏览器的访问记录,可以看到在 访问weibo.com 时 http响应的302 status,以及浏览器被重定向后 http://us.weibo.com 的http 请求和响应信息,并且可以看到后面“远程IP” 的变化。

而笔者在访问时并没有身在国外,也没有使用国外的IP 等代理proxy 访问,笔者通过访问 ip.cn 可以看到的公网IP如下:

BUG定位信息:
访问者IP:106.3.82.*
访问者所在地址:北京
登录状态:新浪微博未登录
访问地址:http://weibo.com
访问方式:浏览器直接输入

不知道是否有北京的其他用户遇到同样问题,请新浪微博的朋友关注下。

原文地址:http://blog.didu.me/article/394

Tags: ,,.
05月 16, 2012

文/Donews博客作家 刘三德

这几天新闻可谓焦点比较集中,各大互联网公司争相要做手机。相关新闻整理一下,1:奇虎360CEO周鸿祎“做了一个艰难的决定”,要做一款特供定制手机;2:百度 与长虹联合发布云手机,价格不超过1000元;3:盛大手机将于6月初发布,内置有你、云中书城、麦库、切客等盛大旗下多款应用;4:据透露,网易手机样机已完工,但具体上市时间未定。1000千元以下;5:小米手机青春版热血而来 1499元新一代性价比机王……再加上之前早已发布的阿里云手机,国内顶级的互联网公司大部分都参与到“做手机”的行列中来了。甚至连“外行”的做英语培训的老罗(罗永浩)同学,也加入了做手机的行列。

从去年开始,除了传统的手机制造商的动作外,市场经历了阿里云手机雷声大雨点小的过程,而后小米公司高调发布了第一款小米手机。当然,小米公司从成立之初就不是互联网为主要业务的公司,所以严格意义上来说应该不算互联网公司。但是作为互联网老兵的雷军,从其言行和多次的直接表达可以了解,小米是在用互联网公司的思维在做手机。

而今年,首先是众多的互联网公司或低调或高调地宣布退出基于android定制的手机rom系统,而后发展到现在,更是大家一溜烟排着队商量好了似的密集发布自己的手机或者手机制造计划。从这一点上来看,互联网真的是一个随时会发生快速变革的行业,稍微一个不留神就可能落伍,而正是在这密集的变革中才充满了机遇与机会——这正是互联网的巨大魅力之一。

还是回到核心话题,为什么互联网公司都做手机?

在前几日举行的第三届GMIC(全球移动互联网大会)上,主流的思想都是认为移动互联网刚刚兴起,会有很多的机会在里面。

截止目前,百度在PC端的搜索市场份额为80%以上,而其在移动互联网的搜索市场份额仅为50%左右,而在一年前“2010年第四季度”的数据显示百度在移动互联网搜索的市场份额为36.11%。

再来看网购的两张数据图:
从以上数据基本可以看出,在移动互联网端,不同领域的各公司市场份额均和传统的互联网端有较大不同。据了解,门户网站在移动互联网的市场格局与传统互联网门户格局相比差别更大。仅凭这一点就可以说明,移动互联网还有很多事情可以做。而最近一两年的智能机普及都是大家有目共睹的,硬件条件的高速发展,造成互联网软件应用等在短时间内达到一定量的井喷也是必然的。
Tags: ,,,,.
05月 11, 2012

今天5月10日是第三届GMIC (全球移动互联网大会)举办的第一天,举办地点在北京国家会议中心。作为全球级别的大会,现场有众多的应用开发者参加了会议,来自全球的移动应用产品和平台供应商等各路人马也都纷纷在现场拉开架势展览宣传。

长话短说,先就现场观察的一些LBS方面的应用和发展来简单聊一下。

参观的第一个LBS 相关展台是图钉gypsii,图钉的几位工作人员也在现场。之前曾听说 gypsii  被新浪微博收购,但是通过和现场工作人员的交谈了解到 gypsii  只是新浪投资的合资公司的产品,在gypsii 的网站上也证实了这一点。gypsii 现场推荐了一个网站 tuding001.com ,之前不熟悉这个网站的朋友可以去访问下。笔者认为图钉tuding001.com才是真正的一个 pinterest ——是真正的基于兴趣的图片社区,在网站上已经淡化或者去除了地理位置相关的签到展示。
此外,在gypsii 的网站上我们可以看到在公司产品信息介绍里面有“微领地”,而微领地之前一直是“类街旁”的产品,主要功能基于LBS 签到相关的互动和展示。由于新浪微博前一段时间刚刚高调发布了LBS应用平台,据说微领地 也有针对性的进行较大改版。其实新版的“微领地”笔者还没有体验,但如果还是基于LBS签到作为主要的产品功能,笔者认为改版的意义不大。

之后又去了“大众点评”的展台,在大众点评的展台前有两位工作人员在忙碌着向周围参观的朋友介绍着自己的产品。可能是去得时间太早了?大众点评的展台前面并没有多少宣传材料的展出。作为国内移动终端 LBS类服务的领跑者,大众点评 在今天大会的主会场和分会场被众多的参会者和企业提到,笔者认为大众点评其实应该加强在 GMIC 各大主分会场的宣传力度,毕竟也是非常受同行业关注的一个产品。


上图为大众点评 在 GMIC 的展台现场

关于微信、陌陌和米聊 等社交类LBS 应用,可能是展厅太多的缘故,笔者没有找到两者的展台。但是这并不妨碍它们成为被关注对象,在上午主会场的高端访谈中,主持人王利芬在采访腾讯公司CEO马化腾、小米公司CEO雷军时都多次提到了微信、米聊。而从目前的介绍来看,米聊正开始向移动社区方向发展,这本身和微信、陌陌 的发展道路已经有了一定的差异。雷军 在接受采访时戏称“微信是QQ的马甲”,但笔者对此持保留意见。据目前的发展现状来看,微信的主要产品体验和关系链构成与QQ还是有比较明显的差异的。如果说作为QQ产品的延伸,应该还是合适的。

之后笔者在新浪微博开放平台的展台前停留了一会儿,恰好遇到几位年轻的外国朋友过来聊天。通过交谈得知,这几位是来自芬兰的创业团队,一位很年轻的帅哥递上名片,上面印着的title 是CEO。他们目前开发的应用为基于LBS的交友应用,来北京此行的目的是参加大会寻找合作伙伴。访问他们的网站可以看到,其网站显示目前主要是beta版,通过简单的浏览和体验笔者认为其交流方式比较类似我国早期的博客网站follow5.com 的一版界面体验(之前在“浅谈LBS和微博的关系发展“ 一文中笔者层提到过follow5.com 并有对应截图)。而且通过笔者之前已经接触过的国内在相关领域的创业项目可以得知,国内类似的产品已经很多,核心体验就是:基于地理位置签到或发布富集的文本媒体内容等、在地图上根据对应的地理位置进行描点展示或筛选、可能会加入一些推荐和陌生人的互动元素在里面。

正如在某个开发者大会的分会场中一位同行提到:在LBS 类型的一类应用的产品水平,国内已经不输于国外,甚至国内产品部分有明显的领先优势。

此外,有一个产品还是值得推荐的,那就是来自我国台湾的wawabank,创始人在现场也介绍了一下wawabank 的现状和发展。同样是基于LBS的终端应用产品,wawabank 在取得了一定的成功后已经开始进军大陆市场,而且目前在大陆已经和一些金融机构等有相关合作。wawabank 自称也很愿意和大陆的同行共同探讨基于LBS的移动支付和消费行为等。关于wawabank,笔者计划后续会写文章专门分析并与大家讨论。

综上,并结合今天和一些同行的交流,整理出以下观点:
1. LBS 应用中,单纯的基于签到的应用缺乏吸引力并将逐渐没落。笔者之前的文章中也曾提到过
2. 基于LBS 的移动交友,此类应用目前已经比较多,同类的非大公司级别产品再进入意义不大。而涉及到社交和关系链请看笔者之前的文章“也看国内Path 类产品的发展,私密社交与关系链构建” 中会有更详细的观点
3.基于LBS 的移动应用,国内同类产品相比国外已经具备了一定优势。甚至很多概念的应用要更加领先
4. 类似产品中,大众点评 依然坚挺,比较受关注(非软文广告) 。 当然很多人也谈到了大众点评 的强大优势在于其内容库,甚至很多大公司的后起产品都在抓取大众点评 的内容库。而在面临商业化等问题时,大众点评能否处理好商家点评的客观性等问题,也是大家有讨论的。
5. 基于LBS消费类的产品,以及消费模式开始兴起。在“浅谈LBS和微博的关系发展” 一文中笔者曾有过类似的观点:结合线上线下 online to offline 此类的 o2o 应用在真正为用户做一些实事的时候,还是有很大乐观前景和期望的。

此外,留一个悬念。其实在细分领域等,还有很多观点可以思考和讨论。

也欢迎相关朋友在微博上一起讨论。

原文首发于:http://blog.didu.me/article/367

Tags: ,,,,,.
背景介绍:如果说最近两年互联网最火的产品概念是什么?移动和社交绝对算得上最受关注的领域——应该说都不是之一。大家也都在大谈各种社交概念,随着智能机的普及、微博的火爆。我们注意到了最近连北京公交车都开始配备WIFI 了,微博带火了无线网络的发展,从今年公布的数据来看,中国移动和中国联通的数据业务都有了较大的增长。而反过来,无线网络的繁荣和职能终端机的普及,也催生了一大批移动终端应用。当然,这其中也有很大影响是来自国外的产品发展趋势。
Path 火了,火在用户规模上,火在估值和融资规模上(已累计融资4000万美元,估值2.5亿美元),其漂亮的UI设计和交互体验也广受追捧。据报道,目前国内类 Path应用已经超过10家,原文见“国内类Path应用超10家:设计师为主导 VC介入”,而且其中多家已经获得投资者跟进。
在移动社交方面,从去年开始,已经有了微信、陌陌等一大批应用出现。微信在上个月已经宣布用户数突破一亿,陌陌也宣布用户数达到300万。而随着Path 的火爆,今年的移动社交貌似也找到了新的聚焦点——私密社交。
资料显示,Path与目前众多SNS应用的区别在于强调私密社交,其原理基于英国人类学家Robin Dunbar的研究成果,那就是在任何时候,人们最多能与大约150人维持稳定的社交关系。所以,目前很多的类Path应用也都采用了相同的好友策略,限制好友数目在150之内。下图显示的是国内目前较知名的类Path应用。
国内类Path应用的发展情况
图:国内目前较知名的类Path应用(来自腾讯科技)
这里不得不提一下所谓“弹性社交”的概念,百度百科里的解释“ 弹性社交是一种新型的社交网络新概念;即由有一定关联的人构建即兴即时的可远可近的社交网络群组。这个概念最早来源于《Color融资4100万美元的猜想》“。在此理论的基础上,我们衡量陌陌、闪聚等APP应该属于弹性社交的范畴,是基于用户地理位置或者兴趣点的社交应用。这类应用构建的关系链是”即兴“的,另一方面也就意味着这种关系链是脆弱的——弱关系链。而微信则应该属于更加兼顾的产品,既有”附近的人、摇一摇“等方式可以生成新的用户关系,同时很多用户也用微信导入了既有关系链——强关系链(注意:这种既有关系链不是依赖于腾讯QQ 已有的用户关系链)。
而现在的Path类应用主体上是属于私密社交,就目前来看,关系链更多来自用户已有的关系。显然这和”弹性社交“的概念是不同甚至相反的,也就意味着这种用户关系应该是更加强势的用户关系链——强关系链。我们可以推出:Path上主要的用户关系在于熟识的人——需要双方互为好友才可以看到对方动态——这种动态的传播范围是有限的。是不是很熟悉的流程?想到了:FACEBOOK、人人网(原校内网)、开心网(kaixin001.com)不正是基于这种用户关系构建的用户关系链和体验吗?那么,笔者甚至可以认为,Path类应用挑战最大的是已有的类FACEBOOK 社交网站,Path甚至可以看成是这种已有社交网络的延伸。FACEBOOK 会坐不住吗?目前没有,甚至有业内人士称:FACEBOOK根本就不会鸟Path 这类小应用。国内呢?人人网、开心网会有危机感吗,会有动作吗?这也是为什么人人网、开心网都急于推出自己的类Path 客户端应用的原因吧。但是,人人网和开心网的优势在于 ,他们已经拥有了用户关系链,而这种关系链是和Path 高度重合的。而与此同时,国内的其他Path 类应用就面临一个问题,第一:在用户体验缺乏很大优势的前提下——Path本身的用户体验还是有很大独特的吸引之处,这种优势将很容易消失;第二:众人争相模仿、产品同质化严重的前提下,如何让用户导入现有关系链参与”私密社交“?
还是有必要再谈一下微信,前几天——大概4月19日微信发布了新版本。在新版本中可以很明显的发现的一个重大变化就是增加了”朋友们“,简单的体验后,笔者认为这也是在模仿Path 的功能。但是微信的优势在于,用户量已经突破一亿,而且大量用户已经建立了”强关系链“——熟人关系链,这个时候发展”私密社交“的优势还是比较明显的,而且能够增加用户间的互动机会,以便更加增强产品的用户黏性。而陌陌、闪聚等当前趋向于”弹性社交“——建立”弱关系链“ 的产品,也是可以参考Path 设计增强用户社交体验的功能,但不一定是做完全的私密社交。
综上,对于Path 类产品在 国内的发展,笔者认为已经拥有用户强关系链的产品有更大机会获得发展。而就以往国内互联网发展的惯例来看,同行业类型的产品基本都是只能做到一两家独大的局面,更多的产品和应用会被淘汰。
注:由于时间有限,本文没有对几种产品的关系链具体特点和应用做分析,待以后有时间补充。也诚恳接受任何批评和拍砖。
原文发表于2012 年 4 月 23 日
Tags: ,,,,.