01月 31, 2013

固态硬盘是这几年很火的东西,2011年FusionIO上市后固态硬盘业界更是的热闹,融资,收购,一笔接着一笔,上个礼拜我们还报道了Violin Memory对GridIron的收购。固态硬盘,尽管价格比传统硬盘高,但是性能优势明显,很多有复杂运算要求的大型企业的大型系统不惧高价,开始使用固态硬盘,但在中小企业这块市场的拓展却不尽如人意。我时常在各大媒体上看到关于固态硬盘取代传统硬盘的评论,大意无非是:固态硬盘各方面性能都比传统硬盘要好,随着价格的降低,将在各个领域彻底取代传统硬盘。这样的观点和说电动汽车就将取代汽车一样,说起来美好,看起来合逻辑,实际上却没有什么理论或者实践的支持。

这里需要扫个盲,有专业背景知识的可以自觉跳过这段。我这里说的传统硬盘是Hard Disk Drive(以下简称HDD),这是我们电脑里那块会自转的金属盘,数据储存在这块金属片上,通过读写头和金属片的相对位置来读或者写数据。而这里说的固态硬盘是Solid State Drive(以下简称SSD),功能和HDD一样,但原理不同,数据是储存在一些相互联系着的闪存芯片上。这些芯片可以安装在系统的主板上(如一些小的笔记本电脑和上网本),可以安装在PCI / PCIe卡上(如一些高端工作电脑),或者单独有一个盒子然后连接到机身(绝大多数都是这样)。

(上图中左边是HDD,右边是SSD。)

回到正题:为什么固态硬盘的取代传统硬盘没有想象中的那么容易?

SSD的降价现在完全寄希望于通过减小特征尺寸(Feature Size)和提高每个储存单元(Storage Cell)上所能储存的比特数(Bits)来提高闪存的密度(Flash Density)。针对这种趋势,除了最先的(低密度,高价,每个单元只能储存一比特)单层存储单元(Single-Level Cell, SLC)以外,还开发了可以多层存储单元(Multi-Level Cell, MLC)。这些单元的存储量大,存储密度高,价格也便宜,但一个很重要的副作用确实因为其结构本身带来的不稳定性。具体的原理就不赘述了,请大家自己看近来加州大学圣地亚哥分校和微软的一次联合研究(点开链接后选FAST2012BLEAKFLASH那篇),该研究从理论和实验两方面同时证明了闪存密度和稳定性的反比例关系。除了稳定性以外,更重要的是读和写的延迟时间也会随着存储密度的提高而提高。低价的MLC的延迟时间要远大于可比的SLC,如果要用MLC但要减少延迟时间也可以,那就要提高容量(Capacity),但这样一来价钱又贵了。

说到价钱,近年来,虽然SSD的单价每年都在跳水,但2012年的跌幅首次放缓到在100%以内,接下去的降价速度能多块还真不好说。可是即使已经大幅降价,现在每GB的SSD平均单价依然在0.5美金左右,大约是HDD单价的 10 倍。有多人愿意为性质去支付这么多的溢价呢?

总的来说,在未来我们继续会看到固态硬盘一些指标在未来继续优化,比如说密度,比如说每比特单价(虽然降幅会大不如前),但其他的各项指标(尤其是可靠性和速度)随着密度的上升和单价的降低会受到很大的冲击。没准SSD会长期处在一个和现在一样的尴尬境地,要么价格太贵,要么表现优势不明显。它在一些大型运算中的需求不可否认,但以现有技术要完全普及,可能还要很久很久。

后记:之所以这篇是“之一”,是因为我想在以后写写关于SSD的其他一些猜想,具体的需要查阅一些资料,请大家耐心。最后想和大家道歉,因为没有接受过这方面的中文教育也没有进行过这方面的中文阅读,所以有些名词的中文可能不对,我都在括号里写上英文了,请大家谅解。

Tags: ,,,,.
01月 30, 2013

上周Facebook很迅速的屏蔽了两个应用:Twitter一款叫Vine的视频分享应用和俄罗斯搜索引擎公司Yandex一款叫Wonder的社交搜索应用。我本觉得写这种狗咬狗的准八卦档次太低,但满街的“Facebook是恶棍”之类的言论让我实在有点忍不住。

说实话真的没什么好意外的,从来就没有真正意义上的开放平台。这里提醒开发者们,Facebook对于其所谓的开放式平台有几个很重要的条款:

不能和Facebook已有的功能(a core Facebook product or service)进行直接竞争。Wonder估计就死在这条明白得不能再明白的条款上。两周前Facebook刚刚推出了自己的图像搜索功能,尽管没有Wonder的功能看上去这么好用,但Facebook已经说得很清楚不会去养一个直接竞争者。这样的例子在业界也不胜枚举,早在09年的时候苹果就曾屏蔽过Google Voice,后来因为监管部门的压力还解禁。同样的还有Google对AdWord API的种种限制。

基于Facebook平台开发出的社交应用必须对Facebook本身的社交应用有贡献(If you use any Facebook APIs to build personalized or social experiences, you must also enable people to easily share their experiences back with people on Facebook)。这条直接打死了很多通过Facebook让用户找到好友,然后就彻底和Facebook没了关系的应用。这方面近来比较好的例子也许是Voxer了,这是一款语音留言的应用,通过Facebook找到好友后可以让你同好友进行语音留言。开发者显然还做了不少功课,提供了把语音留言重新分享到Facebook上,以为这样就能逃过屏蔽。但由于用户多用这款应用传递私人留言,很少有分享回Facebook的,于是就被Facebook屏蔽了。

不能将从Facebook上获取的数据用于搜索(must not include data obtained from [Facebook] in any search engine or directory)。也有不少人说Wonder是死在这条上的,因为Wonder的本质是一款基于搜索的社会应用。这条应该算是一条比较不常见的条款,不是很清楚为什么Facebook会这样规定,我提两点猜想:1,搜索,和时间轴一样,一直是Facebook很重要的发展方向,所以Facebook想提前消灭竞争者;2,Facebook一直强调,从Facebook上获取的数据只能用于应用的功能性,而不能对数据进行再分析或者再处理,如果允许将数据用于搜索的话,希望借用Facebook数据进行分析的开发商,就可以开发一个搜索应用,再用应用本身(而不是Facebook)获得的数据进行研发。

过去一周Facebook的事情掀起了太多太多的口水,很多人说开放平台已死,很多人把Facebook描述成世界上最邪恶最自私的公司。其实哪个开放平台都一样,在不能改变现状的情况下,开放者只有在细读平台条款的情况下自己小心。只要你遵循平台的规矩(当然,你还不能和Twitter有关系),那还不至于被Facebook屏蔽。

Tags: ,,,.
01月 8, 2013

创业者在开发产品的时候常会有这样的问题:什么样的功能对我的客户才是有价值的?什么样的功能是客户需要的而我现在还没有提供的?一般情况下,回答这些需要通过大量的数据分析和客户调查。而创业公司通常没有大量的数据,更没有资源进行大规模的客户调查。

Eric Ries在他的The Lean Startup(精益创业)一书中提出过一个叫做minimum viable product (最基本的能用的产品)的概念,意思是做出一个最基本的产品,看看有没有用户使用,如果有用户使用的话再对产品进行完善。

今天讲一小招,把minimum viable product的概念发挥得更进一步:做一个空壳产品。别紧张,听我说下去。

举个简单的例子,如果目前为止你的产品都供客户免费试用,现在想看看有没有客户愿意为你的增值服务付费。把一个付费功能的前台后台都做出来需要不少精力,同时还需要把增值服务做出来。所以,不妨先把增值服务的开发放在一边,只是在网站上对你想提供的增值服务做一个简单的介绍;把付费功能也放在一边,只是在前台做一个“支付”键。客户在按了支付键以后,你可以选择打电话向他们解释服务暂时处于维护阶段,或者给他们发自动的邮件。这样一来,你可以迅速的调查到有多少客户愿意用你的增值服务。如果有足够多的用户愿意用你的服务,你就可以考虑去开发支付功能和增值服务。

当然这样的做法也有两面性,实际操作的时候需要创业者者自己去衡量利弊。试想,如果客户迫不及待的想使用你的付费功能,却被一封自动邮件告知系统维护,客户很有可会失去对你的产品的好感和信任。一个能更好的利用空壳产品的例子可能是邮件提示。比如说,你想看看有没有用户愿意从你那边收到每周收到一次周刊总结,不妨就在前台提供这个选项,如果用户足够多就可以开发这个功能。和支付不同,这个周刊不必即时发生,让你有了更多的时间可以开发这个功能。

所以说,空壳产品,有利有弊,在不同情况下的使用效果也不同,具体操作起来就要靠创业者自己去拿捏了。

Tags: ,,,.
01月 7, 2013

写在前面:本文中的有些技术已经存在了,有些还不存在,有些则正在被研究。这里,只想简单的列举我的几个猜想

第二屏幕

美国90%的电视观众在看电视的时候会同时看手机或者平板电脑,可是还很有电视节目去利用这“第二屏幕”。绝大多数人在手机或者平板电脑上看的内容与他们此时正在看的电视节目无关。未来,我们也许会看到很多电视人在制作节目的时候还会同时制作供在“第二屏幕”上看的内容。可能是电视节目导航类的工具,比如说简单到一个节目表,复杂一点的可以是对类似的节目的推荐或者是对这个电视台接下来几档节目的简介。也可能是社会类的工具,比如说所有关于这档电视节目的最新微博,或者让你与此时此刻也在看这档节目的好友进行实时聊天,再或者是根据你的社会关系向你推荐电视节目。

现在已经有不少app在提供类似的功能,节目导航类的有zeebox和i.TV等,我还不知道基于电视节目的社会类app,但有不少基于视频的社会类app,比如说Showyou,Vodio和Frequency等。

互联网将大规模的独家上映一些电视节目(而不是重播电视上已经有的节目)

我说的不是Hulu,Netflix那些传统的电视节目点播网站,而是仅仅通过网络播出的电视节目。电视的通过收视率抬高广告售价的盈利模式决定了电视台不会播放受众很小的电视节目。但这并不能说明这些节目不盈利,这是不能进入拥挤的电视市场而已。

Hulu上现在已经有了7档它们首播的节目,可以想象,未来,这个数字将越来越大。

遥控器

我不明白,为什么我们身边所有的设备都更新换代了这么多次,遥控器在过去50年却几乎没有变过。(下图是最早的一款遥控器之一。)

电视遥控开关的最大问题是,由于起初的电视没有屏幕上的菜单,很多功能就必须通过一两次按键完成。但随着电视机本身的功能越来越多,遥控开关上的按钮也越来越多。我刚才数了一下,我家的电视机有两个遥控开关,按键总数超过一百个。别说我妈妈不会用, 连我那低智商的女朋友都不会用。可是,随着现在电视机屏幕上的菜单功能越来越完善,为什么遥控开关不能像早期的iPod一样呢?简单的几个上下左右渐进后退键来控制电视屏幕上召唤出来的菜单。

现在遥控器功能的app已经很多,界面也简洁很多。如果用户还是习惯用传统的遥控器来控制电视,那么遥控器本身的外观必须改变。

Tags: ,,,,.
01月 6, 2013

我时常听创业者说自己的公司每天会生产/记录很多的数据,虽然他们暂时还没想明白怎么用这些数据,但把这些数据都先存起来了。他们经常还说,通过这些数据他们的产品/服务将得到很大的提升,仿佛这些数据就是公司的救世主一样。我不想讨论这种观点正确与否,但想在这里解释两个关于大数据的常见误解:

一、数据不等于信息

经常有人把数据和信息当作同义词来用。其实不然,数据指的是一个原始的数据点(无论是通过数字,文字,图片还是视频等等),信息则直接与内容挂钩,需要有资讯性(informative)。数据越多,不一定就能代表信息越多,更能不能代表信息就会成比例增多。我们来看两个简单的例子:

备份。很多人如今已经会定期的对自己的硬盘进行备份。这个没什么好多解释的,每次备份都会创造出一组新的数据,但信息并没有增多。

多个社交网站上的信息。我们当中的很多人在多个社交网站上活跃,随着我们上的社交网站越多,我们获得的数据就会成比例的增多,我们获得的信息虽然也会增多,但却不会成比例的增多。不单单因为我们会互相转发好友的微博(或者其他社交网站上的内容),更因为很多内容会十分类似,有些微博虽然具体文字不同,但表达的内容十分相似。

二、信息不等于智慧(Insight)

好吧,现在我们去除了数据中所有重复的部分,也整合了内容类似的数据,现在我们剩下的全是信息了,这对我们就一定有用吗?不一定,信息要能转化成智慧,至少要满足一下三个标准:

可破译性。这可能是个大数据时代特有的问题,越来越多的企业每天都会生产出大量的数据,却还没想好怎么用,因此,他们就将这些数据暂时非结构化(unstructured)的存储起来。这些非结构化的数据却不一定可破译。比如说,你记录了某客户在你网站上三次翻页的时间间隔:3秒,2秒,17秒,却忘记标注这三个时间到底代表了什么,这些数据是信息(非重复性),却不可破译,因此不可能成为智慧。

关联性。我们曾经对关联性的重要性进行过解释。这里不再赘述了,无关的信息,至多只是噪音。

新颖性。这个和我前文举的那个社交网站的例子类似,不同的是,这里的新颖性很多时候无法仅仅根据我们手上的数据和信息进行判断。举个例子,某电子商务公司通过一组数据/信息,分析出了客户愿意为当天送货的产品多支付10块钱,然后又通过另一组完全独立的数据/信息得到了同样的内容,这样的情况下,后者就不具备新颖性。不幸的是,很多时候,我们只有在处理了大量的数据和信息以后,才能判断它们的新颖性。

说了这么多,是想表达,其实我们手上有用的数据并没有我们想象的那么多——大数据本身就是个耍噱头的词。在如今这个年代,一个普通的创业公司每天就能生产1GB以上的数据,稍微大一点的公司每天生产的数据都以TB来技术。但在花钱进行大数据分析之前,我们要意识到,数据不代表信息,更不代表智慧。

Tags: ,,.