之所以想起这个话题,是因为看到xiao以内行身份在月光博客的留言:
作者说百度抄袭google链接分析专利的说法是可笑的,李彦宏的确拥有超链分析专利,而且这个专利的日期要早于google的专利,这在美国专利局网站上都是可以查到的。
我立刻在美国专利和商标局网站查了一下,发现Lawrence Page(即Larry Page)共有两项专利被批准,其中于1998年1月9日提交的PageRank的专利申请(PDF文件下载),于2001年9月4日被批准,美国专利号6,285,999。
根据百度页面上的提示,Robin Li(李彦宏)于1996年即在美国提交了超链分析的相关专利申请(filed a patent on the hyperlink analysis in the United States。不过,百度中文页面上则说是李彦宏获得了美国专利,但没提超链分析)。我以发明人姓名“Robin Li”为关键字(IN/li-robin),在USPTO网站查询,已获批的专利查询结果为“0”,专利申请查询结果为“1”。不过,后面这个申请是去年10月份提交的,跟搜索引擎无关,作为发明人之一的Robin Li,应该不是李彦宏。
百度自己的网站上,能找到一些有关超链分析的说法,并称李彦宏是这一专利的惟一持有人的,但关于该专利申请和获得的详情几乎没有。只是在这篇《程序员》杂志2003年的采访中,闫辉问起有关该专利的情况时,李彦宏回答道:“在美国,有专业的专利律师。但当时这个专利是我的职务发明,所以发明人是我,拥有者属于我任职的公司,而公司又不懂这个东西的重要性,也不愿意去冒风险打官司。”有没有知情者可以告诉我这个专利的专利号?
以前我曾在很多地方看到,李彦宏说上世纪90年代中期,他在澳大利亚讲超链分析,有两个斯坦福的学生坐在台下,后来这两个学生做出了Google。不过我一直没太搞清楚这事儿的先后次序,到底是李彦宏的启蒙在前,还是Page和Brin的实践在前。终于梁冬的书中找到了答案,这个会议的时间是1998年4月,地点是澳大利亚的布里斯班。如果没有搞错,这应该就是第七届国际WWW大会。不过这时候,Google的前身BackRub已经在斯坦福大学的网络上运行了两年多。
我在这次大会的网站上,找到了一些更有趣的信息。Larry Page和Sergey Brin著名的论文,《一种大规模超文本Web搜索引擎的分析》就是在这次大会上提交的,作为对PageRank技术最早的公开阐述,这个论文后来被大量引用。
不过,在这个网站上,我没能找到有关Robin Li的任何信息,包含Page和Brin的网页,倒是可以找到一些。
本文只有疑问,没有结论。
百度首席产品设计师俞军过去很欣赏这样一句话:“我们若能更妥善地搜寻资料,实在已经改变世界。”我也很欣赏,但我同时认为,这种改变是有限的,总有太多的真相,存在于搜索引擎之外。搜索引擎的确可以帮助我们获得很多不为人知或被历史尘封的信息,但我们所能掌握的有价值的信息,还是太少,常常不足以支持一个准确的结论。
另外,请大家有话好好说,不要互相攻击。
Update: 在有关朋友的提示之下,重新以“Li Yanhong”这个名字搜索,找到了相关专利,美国专利号:5,920,859。专利提交日期为1997年2月5日,批准日期为1999年7月6日。这项专利是关于超文本文档检索系统和方法(Hypertext document retrieval system and method)。相关专家可以来分析两个专利的相似性。




搜索时代!基本上社会属性的人一言一行都会搜个片甲不留!
Jonson Yuen —— 2006-05-08 @10:02
唉,要忽悠是越来越难了
广告小蝎 —— 2006-05-08 @10:16
呵呵,好,我喜欢这样的考证。
DemonFox —— 2006-05-08 @10:21
确实是大人物。说个谎话脸不红,心不跳。
小发 —— 2006-05-08 @10:24
忽悠不行还有大棒,历史都可以被当成婊子,个人的言行就更不足轻重了。百年后谁还记得谁?
billy.gao —— 2006-05-08 @10:27
中国人就喜欢这样,不脚踏实地做事,支持Google.
19楼 —— 2006-05-08 @10:44
中国人就喜欢这样,不脚踏实地做事,支持Google.
19楼 —— 2006-05-08 @10:45
如今这个时代,靠忽悠已经不行了。
nings —— 2006-05-08 @10:49
专利不专利是不重要的,关键的是谁的算法更好!!!
掠夺者 —— 2006-05-08 @10:52
谁先谁后应该没什么关系吧,
公关 —— 2006-05-08 @11:05
随着网络或者说国人对法律意识越来越重视的情况下,专利以及版权这样的概念慢慢的成为了流行的名词。对于这个已经使用了多年的技术,现在去翻历史查证是到底哪里处了错?这样做只能用来……,呵呵,省略中间的一段议论。
对于超链分析和PR的专利问题,其实我们并不在意,谁在用这个技术也不重要;对用户来说,这个技术最终的实现结果才是最重要的,无论怎么说Google对这个技术的应用让我们了解了这个技术,百度的表现却不明显。
chenmi —— 2006-05-08 @11:22
李彦宏玩搜索确实比较早…
KESO怎么老针对他…
kk —— 2006-05-08 @11:37
keso我经常看你的blog,从个人角度上来将,我不是很喜欢你,因为从你的文字中,总是能察觉到你贬低自己国家的痕迹,但是无论如何,这个没关系,下面我说说你发这个文章这个事情。
我看了你这个文章后花了30分钟,在网上找了资料,大致是这样:
首先:根据Wayback Machine,在1998年2月7日,这个连接:(http://web.archive.org/web/19980207005953/http://backrub.stanford.edu/)中,BackRub中没有提及任何PageRank的资料,实际上我看到的,从文字上可以感觉到BackRub自己认为自己是一个Web Crawler。
然后:到了1998年10月,请注意,这个时间是在1998年4月之后,BackRub正式使用了Google的域名:(http://web.archive.org/web/19981206025554/http://backrub.stanford.edu/),从此BackRub就没有再更新过。
为了继续调查,我看了Google.com的历史纪录,在这里(http://web.archive.org/web/*/http://www.google.com),可以看到第一个纪录是1998年10月,这个(http://web.archive.org/web/19981202230410/http://www.google.com/),其中首次出现了PageRank这个字眼,在这个页面(http://web.archive.org/web/20000301130432/www.google.com/adv_features.html)。
总结一下,大致是这样:
1997年2月 Li Hongyan 提交了类似PageRank的专利申请,1998年4月Li Hongyan 于澳大利亚演讲,其中在座听讲的有Larry Page和Sergey Brin,同时他们已经有了类似PageRank的论文(但是这个时候已经距Li Hongyan提交专利申请1年了),1998年10月Google上线,正式使用PageRank这个字眼,但是Patent Pending,1999年7月Li Hongyan的专利获得批准,2001年9月Google专利获得批准。
以上文字如果有错误,也很正常,因为我才花了30分钟的时间。
美国专利和商标局,毕竟是美国人的机构,2001年时偏袒一下当时已经很厉害的Google,这个无话可说。
我从来不用Baidu,但是,作为技术认为,我知道要维护一个Baidu这样的搜索引擎绝对不是一件容易的事情,虽然Baidu严格上来说是一个美国的上市公司,但是这个毕竟是我们华人开发出来的产品,哎,你们这群人啊,嘿嘿,嘿嘿。
u —— 2006-05-08 @11:50
如果抛开什么华人的身份,百度做了什么?注册地又不是中国,顶多就是为中国提供了很多服务。
但是这种服务并非最好的,也不是没有百度不可的,甚至百度影响了我们更好的获得此类服务。比如中国移动,虽然给你了手机业务,但相信在更多的地方,没有移动的充分竞争会让我们拥有更好的移动通讯服务。除了李颜红跟我们一样是中国人外,对中国人还有什么好处?所以也没必要老拿什么华人来说事吧,好就是好,坏就是坏。
dowei —— 2006-05-08 @12:12
我又花了点时间看了看两个Patent的内容,因为不是这方面的专家,所以很难做出什么评论,不过从一些句子上来看:
Li Yanhong的Patent的概述摘要:
A search engine for retrieving documents pertinent to a query indexes documents in accordance with hyperlinks pointing to those documents. The indexer traverses the hypertext database and finds hypertext information including the address of the document the hyperlinks point to and the anchor text of each hyperlink.
Page的Patent的概述摘要:
A method assigns importance ranks to nodes in a linked database, such as any database of documents containing citations, the world wide web or any other hypermedia database. The rank assigned to a document is calculated from the ranks of documents citing it.
我还是认为,Li Yanhong是这个主意的创始人,Page只是将这个主意Refine而已。
u —— 2006-05-08 @12:14
dowei老兄,请举例一个移动花费比中国移动便宜的国家,香港除外(特别行政区),无论你是否PPI因素,都可以。
u —— 2006-05-08 @12:17
I always think Keso is a rubbish, and poison in China IT industry. Why a small amount of Chinese bloggers always look down at your own country, your local firms? e.g. Wang Jianshuo
Shame for you guys, we oversea chinese love China more than you do.
Chinese —— 2006-05-08 @12:17
有什么样的人就做什么样的事,别的不敢说,2002年那次封Google事件,我倒是全程经历了,做网站做到这种程度,就不是什么专利,什么技术问题了,完全就是人品道德问题。
本来说,抄袭也不是什么见不得人的事,抄就抄了,要认账,别抄了还反咬一口,这是我无法理解和绝对做不到的。
百度创始人如此,百度也如此,前途极其有限…
xpilot —— 2006-05-08 @12:18
哈哈,居然用robin li去查,笑死了
兰斯 —— 2006-05-08 @12:36
u的评论很客观,我补充一点。对于百度是否是中国公司这个问题,最近不少人讨论,有人经过分析百度股权结构,认为外资所拥有股份超过百度总股份的50%,因此百度不是中国公司。
这个观点是完全错误的。
判断一个公司是哪里的公司,要看该公司的决策权掌握在哪些人手里。中国现在有不少在美国上市的公司,但只要其决策权掌握在中国人手中,就是中国公司。
百度在上市的时候,推出了一个“牛卡”计划,“这一股权设计计划称作“不同表决权股份结构”(DualClassStructure)。其方法为,将上市后的百度股份分为A类(Class A)、B类(Class B)股票。将在美国股市新发行股票称作A类股票,在表决权中,每股为1票,而创始人股份为B类股票,其表决权为每1股为10票。而在赴美上市的中国公司中,采用这一股权设置计划的,百度是第一家,也是目前唯一的一家。”
因此,尽管外资所占股份总额超过50%,但并不代表其拥有超过半数的表决权,也就意味着并不拥有对百度的决策权。
那百度创始人股份又主要集中在谁手里?通过分析百度股权结构我们可以看到,主要是集中在李彦宏、徐勇、其他百度其他高管以及部分百度员工手里,一些早期的风险投资也拥有部分创始人股份,但在百度上市后,逐渐卖出获利,而这些股份卖出后,即变成每股1票的A类股票。
因此,百度的决策权牢牢掌控在中国人手中,他是一家在美国上市的中国公司。
顺便说一句,曾有人对李彦宏的身份提出质疑,说其是美国人,纯粹是胡说八道。李彦宏是地地道道的中国人。不仅如此,为了做好百度,他不愿长时间离开中国,前几年把早年在美国获得的长期居住证(绿卡)都已注销。
明心见性 —— 2006-05-08 @12:50
keso, 贬低中国对你有什么好处呢?
是不是黑眼睛黄皮肤让你感到羞耻?
nasi —— 2006-05-08 @13:21
keso在他的blog里面提到了baidu和google的专利问题。刚才我把两个专利的文档都打开看了,并且比较分析了一下。下面我从专业的角度来讨论一下这个问题:
1. 网上争论的焦点是“超链分析”和…
IT静夜思 —— 2006-05-08 @13:37
又在间接玩百狗追黑狗的游戏。
Keso搬石头砸自己的脚,可悲。
写这种文章前应该做好充要的调查。
搜索引擎实用适用就好,
管他妈的谷歌还是百度。
Google有Gmail等很多优秀的产品,
百度也有百度知道等牛气之作,
就像搞编程的整天讨论C++或Java那种语言好,
忘了编程是干什么的人,
不耻。
在这里缅怀一下Beyond的《光辉岁月》——缤纷色彩闪出的美丽,是因它没有分开每种色彩。
非常可笑 —— 2006-05-08 @13:38
还有多少谎言?
还有多少故事?
百度,百度,
百毒在身,流毒世界。
哈哈
http://daatou.bloggoing.com/ —— 2006-05-08 @13:39
大致比较了一下两个方法,其实ROBIN LI的方法和PAGERANK是完全不同的算法,ROBIN LI的方法是所谓的"虚拟文档"的方法,就是把所有指向某个页面的链接"锚文字"来代替网页的内容,并以此计算和查询的相似性,说实话,在当时来说,这个也是比较有新意的算法,但是和PAGERANK思路是完全不同的,PAGERANK并非计算查询和页面的相似性的,而是计算页面重要性的算法;
malefactor —— 2006-05-08 @13:48
to xpilot:
2002年封Google事件,应该更全面的看这个问题。
如今被封网站越来越多,个中原因我们都能明白一些。
可以想想为什么联合早报相对其它国外新闻网站封的次数少些,原因很简单,联合早报的内容不是很敏感。你认为ZF能让当时能搜出那么敏感内容的google活下去么?
我不替baidu说话。只是我们在这里,就只能接受这样的安排。我不相信baidu有那么大能量。我只相信我们的ZF。
e频 —— 2006-05-08 @13:53
我觉得kose纯属脑子进水型,不知道百度是否挡住了你迈向美国自由世界的脚步?犯得着这样跟百度死磕?还来试图揭人家百度创始人的老底,呵呵,太幼稚了,拿Robin Li来查,您对美国和互联网技术的了解也真是肤浅的可笑吧.首先,您先去进修一下外语,然后再进个大学补一下关于互联网和搜索引擎方面的课,再跳出来献丑可以吗?
google不知道给了你多少钱,你这么免费做爪牙有被李开复欣赏吗?还是准备骂了李彦宏然后,占山为王等招安?就看您的表现呢,估计老李开个差不多的价钱你就屁颠屁颠地过去了,大概你就等的这一天吧,不然真很难解释你的动机呢.
说实话,你再跳脚再激动,没有用处,百度不是靠你这样的人物就可以做到今天的地步的.是靠自身的实力,如果怀疑百度曾经干了什么事情,你可以拿出证据来.退一万步说,我觉得就是干了,又怎么样?中海油不是被美国政府以国家安全的名义狙击了吗?中国为什么不能阻止google进入?
似乎现在骂党骂国已经成了时尚.百度可怜,因为貌似与此有关,就成了IT届被攻击的对象.QQ可怜,因为本土,因为"下等网民"用得多,就成了"精英人士"鄙弃的对象.联想可怜,因为生在中国,即使收购了IBM也被讥笑为画虎不成反类犬.只要你是个中国人,只要你在中国做了点胆敢跟跨国公司挑战的事情,你就绝对成了笑柄和被辱骂的对象?为什么?因为你技术差!因为你在中国的统治下,因为你是黄颜色!
但是骂人的这位keso,你既然这么讨厌自己出生在这个国家,为什么不学杰克逊一样去漂白,去整容?或者投奔自由世界?为什么只会在这里口吐怨言,自己整自己?中国真的不缺你这样的人,缺的是有自尊的中国人.技术粗糙,有时间可以跟上,心没有方向,那才是最大的悲哀.国内这帮技术人员,你们为什么不自己创造一个百度或者QQ,跟跨国企业竞争?那时候,你再来说鄙弃别人的话可以吗?
说实话,百度是什么,外资还是中资,发明技术在前还是在后,一点不重要.重要的是,百度之所以成为百度,不管有没有原罪,不管如何,它正在努力成为一个最好的公司.而且,我觉得百度,完全可以不必要理会一帮各怀鬼胎的宵小们的言语,木秀于林大风催,呵呵.但不是你几句话就能吹倒的,越磨练越成器.百度,QQ,联想,都是如此.
youarefool —— 2006-05-08 @14:02
to malefactor:
你应该仔细读一读Robin Li的专利描述,你所说的“ROBIN LI的方法是所谓的"虚拟文档"的方法,就是把所有指向某个页面的链接"锚文字"来代替网页的内容,并以此计算和查询的相似性”,完全是误读!
小飞 —— 2006-05-08 @14:02
百度李老板如果真认为GG的人窃取了他的专利,应该去告,如果说原先供职的公司没有告的话,真是这家公司不懂炒作(同样也是不坚持原则),告GG应该是件出名的事啊。
如果李老板真的向媒体公开说过谁谁窃取了他的东西,那第三方进行查实、分析都是应该被允许的。
seovista —— 2006-05-08 @14:03
百度可怜,因为貌似与此有关,就成了IT届被攻击的对象.QQ可怜,因为本土,因为"下等网民"用得多,就成了"精英人士"鄙弃的对象.联想可怜,因为生在中国,即使收购了IBM也被讥笑为画虎不成反类犬.只要你是个中国人,只要你在中国做了点胆敢跟跨国公司挑战的事情,你就绝对成了笑柄和被辱骂的对象?为什么?因为你技术差!因为你在中国的统治下,因为你是黄颜色!
——————————————-
youarefool的这段话不错,,
yaryar —— 2006-05-08 @14:13
to 小飞:
我仔细看了ROBIN LI的专利了,再次确认就是"虚拟文档"的思路,不知你说我哪里误读了?麻烦拿出些证据,我没看出哪里误读.还请你指教;
malefactor —— 2006-05-08 @14:22
我觉得baidu应该不会抄袭google的,直觉:)
Tony Bai —— 2006-05-08 @14:42
to malefactor:
我觉得你没理解超链分析的本质,超链分析最重要的思想,不是“把所有指向某个页面的链接"锚文字"来代替网页的内容”,而是“根据页面被其他页面链接的次数和链接中的内容,来计算页面与关键词的相关度”
pagerank的核心思想,和超链分析的区别并不大。
小飞 —— 2006-05-08 @14:57
百度的屁股摸不得,这个说法再次得到了证实。
既然百度官方页面上http://www.baidu.com/about/en/management.html明白的写出了Robin Li (CEO)和Robin Li (Co-founder and Chief Executive Officer)字样,并且没有Li Yanhong字样,不知道keso用Robin Li来查专利有什么可笑的。
国内有些公司的所作所为,真的仅因为是“中国制造”,就要被大家不分青红皂白的爱和捧吗?作为google的fans,看不惯baidu的很多做法,是多正常的事情,还用列举些例子来说明为什么有人不喜欢baidu吗?
动不动上升到汉奸的高度,也太夸张了吧。那个写英语的家伙,你在国外倒是可以眼不见心不烦。keso力捧过国产“豆瓣”,你不妨给些证据显示你的爱国心。
ffish —— 2006-05-08 @15:00
百度的屁股摸不得,这个说法再次得到了证实。
既然百度官方页面上http://www.baidu.com/about/en/management.html明白的写出了Robin Li (CEO)和Robin Li (Co-founder and Chief Executive Officer)字样,并且没有Li Yanhong字样,不知道keso用Robin Li来查专利有什么可笑的。
国内有些公司的所作所为,真的仅因为是“中国制造”,就要被大家不分青红皂白的爱和捧吗?作为google的fans,看不惯baidu的很多做法,是多正常的事情,还用列举些例子来说明为什么有人不喜欢baidu吗?
动不动上升到汉奸的高度,也太夸张了吧。那个写英语的家伙,你在国外倒是可以眼不见心不烦。keso力捧过国产“豆瓣”,你不妨给些证据显示你的爱国心。
ffish —— 2006-05-08 @15:01
我不知道Keso的文章里那一句话贬低中国了?整篇文章一直都在摆事实讲道理,麻烦这位nasi也讲讲道理。keso所评论的百度是一个在美国上市,创始人是华裔,且50%以上由美方控股的美国公司。
Adrian —— 2006-05-08 @15:03
李彦宏、丁磊这些人低调躲开国内媒体是有道理的。
IT江湖险恶,远小人近君子,省得被人背后捅了都不知道是为了啥。
吃冰 —— 2006-05-08 @15:12
我有心把“超链”比作月亮,因为它照亮了搜索界发展的进程;但现在看来它却是搜索界的潘多拉魔盒,keso被传染也中了招,一打开就惹来争论不断,而他自己给《一种大规模超文本Web搜索引擎的分析》加的“超链”也错了—-最好更正一下—免得大家误以为这篇横空之作是子虚乌有。
至于这场百度谷歌专利的争论,在我看来,其实不关先后、仅仅是天资和功力的区别。
我先将李彦宏的专利摘要大致翻译一下:
Hypertext document retrieval system and method
超文本文档提取系统和方法
A search engine for retrieving documents pertinent to a query indexes documents in accordance with hyperlinks pointing to those documents. The indexer traverses the hypertext database and finds hypertext information including the address of the document the hyperlinks point to and
the anchor text of each hyperlink. The information is stored in an inverted index file, which may also be used to calculate document link vectors for each hyperlink pointing to a particular document. When a query is entered, the search engine finds all document vectors for documents having the query terms in their anchor text. A query vector is also calculated, and the dot product of the query vector and each document link vector is calculated. The dot products relating to a particular document are summed to determine the relevance ranking for each document.
一个用于提取与查询项相关文档的搜索引擎。该搜索引擎根据指向文档的超链,对这些文档进行索引。该索引编制器(indexer)扫描超文本数据库,寻找包括超链所指文档的地址、超链的锚文字等超文本信息。将这些信息存储在反向(inverted)的索引文件里,该文件还可用于计算文档连接向量(document link vector),以针对每一指向某文档的超链。当用户输入一个查询项,该搜索引擎找到的所有文档向量,其“锚”文字包含该查询项。并计算一个查询向量(query vector), 然后计算该查询向量和每一文档连接向量之间的内积。将与某文档相关的内积进行累加,以决定该文档的相关度排序。
———-
而keso所找到的sergy和page专利里的《简介和总结》部分我也大致翻译如下:
当查询项与非常多的文档匹配时,目前的网络搜索引擎产生非常差的(排序)结果。但是用户常常送出这样的简单查询项。针对这样的查询,描述在此的系统能产生令人惊奇的结果提升,关键在于使用来自存储网络连接(web link)的大数据库内可用的附加信息。该网络引用(web citation)数据库用于决定每一网页的引用重要程度,据此再对查询结果排序。该系统业已实现,并能产生杰出的结果,哪怕是相对来讲只包含400万网页的小数据库。该系统不仅产生更佳的结果,更显著地减少计算代价,而计算代价却是网络搜索引擎最大的开销。要展示改善的结果,只需挑一个简单的查询项,比如“天气”,然后将我们系统的结果和传统网络搜索引擎的结果(像altavista)比较。
——————-
根据我所了解的page-rank模型,和刚刚所看到的李的专利所述模型,两相比较,我只能说李能想到并妥善利用超链,表现的功力已远非平常人。因为那个时候做信息提取研究的研究者,恐怕都已经意识到要利用到诸如超链和锚文字等附加信息,而问题关键是谁能有功力利用得漂亮。可是在这个层面,裴吉(page)的page-rank模型,凭借极其深厚的理论支撑和显著的优势,让google鹤立鸡群,而李的方法,只能说是未蜕变成鹤、丑过page-rank的丑小鸭。
李的想法是否启蒙后人,是否也启发过page,可能是件无头悬案。但先后之争,在我看来没什么意义,以他们作为研究者的身份,谁知道他们受了哪些前人的影响呢?而
“今人不见古时月,今月曾经照古人”,“超链”这东西,也如同月亮,罩过不少人,但谁也不必太过信誓旦旦说成是属于自己。关键是谁在月光的眷顾下,练就了最强的神功。
vincent wu —— 2006-05-08 @15:17
那是因为,豆瓣还没有强大到和google一拼的能耐,Keso完全可以不用理会.一旦哪天豆瓣不幸崛起,而且也正好是goole或者flickr光荣当机的时候,豆瓣估计也惨了.
什么叫百度的屁股摸不得,google的屁股一样也摸不得.有人敢说一句google的不好看看,早被蛰成马蜂窝了.现在百度和google之争,完全上升到了政治和意识形态之争.我觉得为百度不值.不过一个有志气的中国人想干点事情,却背负了太多的附加价值.而喜欢攻击百度的人,大多数是"技术精英"(姑且算是精英吧,简称技精),大多数是不满而无处发泄的中下层人员,躁动不安又无可安置自己无前途的心,于是,恨铁不成钢地自卑,骂骂百度,立个名头,显示自我.也实在是让人不齿的心态.
说实话,Keso挑这个事情也挺无聊挺下作,都多少年前的事情了,议论来议论去,好象你的论据也站不住脚,不是有造谣的嫌疑吗?
yourarefool —— 2006-05-08 @15:28
to 小飞:
呵呵,我觉得你应该仔细看看PAGERANK的思路,两者是完全不同的.
首先,PAGERANK是跟查询完全没有关系的,它并不是用来计算查询和页面的相关度的,假设一个搜索引擎完全采用PAGERANK来评分的话,不论用户的查询是什么,搜索结果排名是完全一样的,而ROBIN LI的虚拟文档方法是根据指向一个网页的链接文字是否包含查询词汇来计算查询和页面的相似性的,所以首先两者要解决的问题就不一样,出发点是不同的.
另外,ROBIN Li的方法并不能向PAGERANK那样体现"如果指向一个页面的链接数目越多,那么页面权值越大",假设一个用户搜索"JAVA",假设一个页面A有100个链接指向A,如果只有3个链接的锚文字包含JAVA,那么其它97个链接的贡献是0,而PAGERANK是不考虑这种情况的,所有100个链接都对页面A有贡献;
第三,PAGERANK的核心思想是根据页面链接关系通过叠代计算来将页面本身重要性得分进行传播,而ROBIN Lii的方法完全是不能体现这个思路的,只是锚文字是否包含查询对于页面是否相关有作用.
虚拟文档现在已经是一个比较常用的技术了(当然PAGERANK在研究领域应用更广泛),它和PAGERANK无论是出发点,基本思路,计算方法都是有本质区别的.
malefactor —— 2006-05-08 @15:28
今人不见古时月,今月曾经照古人
zhiliwu —— 2006-05-08 @15:33
to Adrian
好好读读,在美国上市就是美国公司么?
——————————————
明心见性 发表于2006-05-08 12:50 PM IP: 220.207.72.*
u的评论很客观,我补充一点。对于百度是否是中国公司这个问题,最近不少人讨论,有人经过分析百度股权结构,认为外资所拥有股份超过百度总股份的50%,因此百度不是中国公司。
这个观点是完全错误的。
判断一个公司是哪里的公司,要看该公司的决策权掌握在哪些人手里。中国现在有不少在美国上市的公司,但只要其决策权掌握在中国人手中,就是中国公司。
百度在上市的时候,推出了一个“牛卡”计划,“这一股权设计计划称作“不同表决权股份结构”(DualClassStructure)。其方法为,将上市后的百度股份分为A类(Class A)、B类(Class B)股票。将在美国股市新发行股票称作A类股票,在表决权中,每股为1票,而创始人股份为B类股票,其表决权为每1股为10票。而在赴美上市的中国公司中,采用这一股权设置计划的,百度是第一家,也是目前唯一的一家。”
因此,尽管外资所占股份总额超过50%,但并不代表其拥有超过半数的表决权,也就意味着并不拥有对百度的决策权。
那百度创始人股份又主要集中在谁手里?通过分析百度股权结构我们可以看到,主要是集中在李彦宏、徐勇、其他百度其他高管以及部分百度员工手里,一些早期的风险投资也拥有部分创始人股份,但在百度上市后,逐渐卖出获利,而这些股份卖出后,即变成每股1票的A类股票。
因此,百度的决策权牢牢掌控在中国人手中,他是一家在美国上市的中国公司。
顺便说一句,曾有人对李彦宏的身份提出质疑,说其是美国人,纯粹是胡说八道。李彦宏是地地道道的中国人。不仅如此,为了做好百度,他不愿长时间离开中国,前几年把早年在美国获得的长期居住证(绿卡)都已注销。
nasi —— 2006-05-08 @15:37
yourarefool,从你的nick到你的匿名,到你帖子中充斥的臆断和帽子,你出色的再一次给baidu做了很有效果的公关。
ffish —— 2006-05-08 @15:37
你最好不要再写百度和GOOGLE.
对这个问题,你不客观,
即使你认为你客观,你挑的问题也只是对GOOGLE献媚,对百度讽刺的份
你从来不曾鼓励过百度
FUCK!
嗯嗯 —— 2006-05-08 @15:58
太抱歉了,我跟百度一点关系没有.也不需要给百度免费公关,更不需要为了百度去辱骂其对手,发掘一下Larry Page和Sergey Brin的私秘史,你一定很失望吧,呵呵.
"这种改变是有限的,总有太多的真相,存在于搜索引擎之外。"
是的,你可以无限的接近真相,但请你不要妄下结论,或者,试图将一个类似谣言的帽子和臆断建立在你自己不懂的论据上:)
yourarefool —— 2006-05-08 @15:58
说说163吧
为了他的免费发短信,才用的泡泡.好不容易积攒了20多w金币.可惜一下子把100金币发一条短信提高到了1000金币.
还有升级为1g的163 mail,好像是2w还是20w金币?
刚升级了没十日,163就提供免费升级到1g mail了.
说说联想吧.收了ibm的pc确实让人兴奋,可是前些日子的think本本主板飞线是怎么回事?真的是主板没缺陷??
qq也可以说说.为了保6位qq号,申请了会员,捆绑了手机.但是除了每个月8快会员费,其他什么我都没消费过,包括没买过任何一个q币.
于是去年9月,平均一天半一条短信,内容都是:xxx功能推出,会员回复xx即可以xx折扣获得.
前后一个多月,我打客服电话过去询问可否关闭,结果客服mm的回答是:
不可能不收到.
如果我不想收呢.
那你就取消手机捆绑吧.
那我就不是会员了啊
那就没办法了,就不做会员吧.
baidu么,实话,目前我还没中过招,所以还谈不上厌恶.因为被3721装过x次后我禁止了很多东西.
很多时候,不去抱怨别人BS.
有句话叫做 自作孽,不可活.
十口 —— 2006-05-08 @15:58
谨防IT娱乐化。
政治局常委 —— 2006-05-08 @16:00
不管怎么样,讨论是有益处的;keso是否崇洋,大家各有各的见地。
baidu是否值得鄙视,应该让用户来说——大部分的用户(60%)喜欢用百度,尽管Google比较客观——说明google对中国用户的关注还没有从技术上升到实用的层面。技术人员看baidu垃圾,但是普通用户感到baidu比google亲切、实用,这说明什么?
不过,keso对这些批评的容忍还是体现了自己的大度的。
sirding —— 2006-05-08 @16:18
我发现中国粪青真多
而且这批粪青的水平还不杂样。离愤青还差远了
inspire —— 2006-05-08 @16:54
1.百度 != 中国
2. Keso 很爱国
3. 有些人太无聊
4. 同意 sirding,keso 很大度, 也可能是觉得有些人不值得去计较
5. 只有无聊的人才会参与类似的讨论,我也是
jicknan —— 2006-05-08 @17:06
这篇文章可以贴 xys.org 上去了……风格完全一致……
Platinum —— 2006-05-08 @17:25
哈哈,这篇是Keso最失败的Google公关稿啦。。。疑问数十行,结论四行。而且Update的结论还是推翻自己之前的质疑的。
我觉得Keso越来越进入一种迷途,Google变得神圣纯洁,于是其他公司和对手就变得邪恶而且歹毒。Keso对Google的迷信进入了一种无法自拔的状态,也就看不到Google的阴暗面。
对于Google,Keso已经失去了客观的角度与中立的立场去分析了,在这一点上,Keso已不是一个优秀IT评论家了。
向微软的Robert Scoble学习一下吧,虽然受雇于微软,但依然可以客观公正冷静理性的分析市场和产品。正是由于他的客观分析,微软的人才得到更多的启发和创意。
要成为一个热门舆论的人物很容易,只需要狠狠的批,乖乖的拍,但要做一个启迪思维和受人尊敬的客观公正互联网英雄并不是那么容易的!
vazi —— 2006-05-08 @17:41
百度,这个自称是全球最大的中文搜索引擎,经过这几年来的发…
草根博客 —— 2006-05-08 @17:49
人家说了不人身攻击了,咋这么多人还不听话呢~~~
路过~~ —— 2006-05-08 @17:51
keso 知错就改还是值得鼓励的,但是u能找到那里专利,而keso找不到那个专利却值得深思呀~
Boler Guo —— 2006-05-08 @18:01
《一种大规模超文本Web搜索引擎的分析》链接错误
应该是http://www7.scu.edu.au/1921/com1921.htm
作者大名似乎也写错了
幻影小飞侠 —— 2006-05-08 @18:04
对牛弹琴的blog很红,之前觉得虽然没有什么建设性的意见,但至少不讨厌blog的作者。
可今天看了这篇文章,发现这个作者真的很无知,而且不懂装懂。
www —— 2006-05-08 @18:45
“我们若能更妥善地搜寻资料,实在已经改变世界。”其实也是GOOGLE创始人说的.俞军最早是个大G FANS,把这句话到处引用,以致现在中文一查,出处都是他.李彦宏有一段时间也老用这句话,公关稿,演讲稿…,当然都是不屑注明出处的了.疑惑,这句话就那么好嘛,他们就非想不出自己的CATCH LINE?但是最早他们是很自觉地把自己摆在G的位置下面的,对G是仰视的,所以处处引用G的话大概是觉得光荣的吧.
KESO提出的这个问题,正是我觉得李彦宏最无耻的一个说法.当时记得他们的提法是G的两创始人在澳洲聆听李的演讲,会后李还解答了他们的问题等等.G当时根本没把中国市场看在眼里,所以李彦宏敢这么黑白讲.现在看他还敢不敢这样讲了.当然,他当时混淆视听的目的也已经达到大半了.
至于KESO在这篇文章中所用的口气,我认为是十分公正的.KESO是IT圈中少有的正直的人之一,所以才对G的脾气.李彦宏最早的时候,为了发展,使用过一些卑鄙手段,说过些卑劣的话,但是也不一定就是小人,小人有更小人的手段,李只能说是个普通人.如果李一早摆出正人君子有所为有所不为的架势,那么百度肯定不会有今天了.牺牲一个君子的虚名,成全了一个百度,才是商人气概.
G呢,是天生的正人君子.可是在中国是会水土不服的.
E.Y. —— 2006-05-08 @19:24
百度就是一狗屎吹牛公司,垃圾卑鄙下流公司,不要脸的公司。呵呵!见一次骂一次,不求能够让它倒闭,只求骂得百度狗门心里不爽。
都来骂 —— 2006-05-08 @19:28
请看这里!
http://blog.donews.com/allogo/archive/2006/05/08/860799.aspx
百度把KESO封啦!! —— 2006-05-08 @19:55
没有必要这样……
首先我认为,存在就有他的合理性。
其次我认为,任何事物也都有两面性。
但从你的一系列文章中,都可以看出你的一个观点:google好,百度不好!
——我不信,百度就没有一点好?
但对于读者来说,可能会感觉到你的偏见吧——难道你不觉得这样的不公证行为会影响你在你的fans心中的光辉形象?
当然,你有言论的自由,你可以讲你愿意说的话。
作为blog的名人,作为有影响力的blog作者,你,没有必要这样……
个人观点……
没有必要这样…… —— 2006-05-08 @19:55
我发现百度的员工都很团结,一发现异己就群起而攻。而且还会变换马甲地发言,真是应验了百度的风格-“为达目的不惜手段”。
gg —— 2006-05-08 @20:41
其实谁先谁后又如何呢
毛爷爷说过 白猫黑猫 能抓老鼠的就是好猫
你做搜索引擎拥有最多的专利 最早拥有什么技术 那又如何呢
用户的体验结果完全可以否认掉一切所谓的专利
所以,给用户带来的多少利益才是权衡标准
Ninstein —— 2006-05-08 @20:43
youarefool 发表于2006-05-08 2:02 PM IP: 202.109.75.*
我觉得kose纯属脑子进水型,不知道百度是否挡住了你迈向美国自由世界的脚步?犯得着这样跟百度死磕?还来试图揭人家百度创始人的老底,呵呵,太幼稚了,拿Robin Li来查,您对美国和互联网技术的了解也真是肤浅的可笑吧.首先,您先去进修一下外语,然后再进个大学补一下关于互联网和搜索引擎方面的课,再跳出来献丑可以吗?
google不知道给了你多少钱,你这么免费做爪牙有被李开复欣赏吗?还是准备骂了李彦宏然后,占山为王等招安?就看您的表现呢,估计老李开个差不多的价钱你就屁颠屁颠地过去了,大概你就等的这一天吧,不然真很难解释你的动机呢.
说实话,你再跳脚再激动,没有用处,百度不是靠你这样的人物就可以做到今天的地步的.是靠自身的实力,如果怀疑百度曾经干了什么事情,你可以拿出证据来.退一万步说,我觉得就是干了,又怎么样?中海油不是被美国政府以国家安全的名义狙击了吗?中国为什么不能阻止google进入?
似乎现在骂党骂国已经成了时尚.百度可怜,因为貌似与此有关,就成了IT届被攻击的对象.QQ可怜,因为本土,因为"下等网民"用得多,就成了"精英人士"鄙弃的对象.联想可怜,因为生在中国,即使收购了IBM也被讥笑为画虎不成反类犬.只要你是个中国人,只要你在中国做了点胆敢跟跨国公司挑战的事情,你就绝对成了笑柄和被辱骂的对象?为什么?因为你技术差!因为你在中国的统治下,因为你是黄颜色!
但是骂人的这位keso,你既然这么讨厌自己出生在这个国家,为什么不学杰克逊一样去漂白,去整容?或者投奔自由世界?为什么只会在这里口吐怨言,自己整自己?中国真的不缺你这样的人,缺的是有自尊的中国人.技术粗糙,有时间可以跟上,心没有方向,那才是最大的悲哀.国内这帮技术人员,你们为什么不自己创造一个百度或者QQ,跟跨国企业竞争?那时候,你再来说鄙弃别人的话可以吗?
说实话,百度是什么,外资还是中资,发明技术在前还是在后,一点不重要.重要的是,百度之所以成为百度,不管有没有原罪,不管如何,它正在努力成为一个最好的公司.而且,我觉得百度,完全可以不必要理会一帮各怀鬼胎的宵小们的言语,木秀于林大风催,呵呵.但不是你几句话就能吹倒的,越磨练越成器.百度,QQ,联想,都是如此.
喜欢这句话
欣赏
断峰狼 —— 2006-05-08 @20:49
从商业或者个人道德上来说,百度确实不敢恭维,可以再想想那个恶心的百度工具条…事实上大多国内企业都不敢让人恭维,所以骂国内企业也是正常的,没必要上升到政治层面。
moonsafari —— 2006-05-08 @20:52
居然还有人以为百度是中国公司?
那个什么断峰狼,我不得不说你是SB
R —— 2006-05-08 @21:41
实际上,深层次和潜意识内,这是个文化和意识形态之争。
在中国的市场条件下,可能拿不出一家干净的公司,这个无法苛求。美国花几百年时间造就的市场环境和竞争条件,中国猝急间不可能达到,恐怕还要数十年的漫长。
如果你生在资本主义原始积累期的美国,大概你就会觉得中国公司所谓“不正当竞争”手段的软弱和苍白,所谓无耻只能是小巫见大巫。
只是觉得国内技术界的短视和浮躁。拼命指责甚至挑拨辱骂,解决不了问题。百度有胸怀,可以从竞争和对手指责中改善成长,也算不了什么。但请批评者保持,善意和宽容。极端民族主义的确让人烦,但没有这点民族自尊心的话,也许未来没有一家公司是中国制造,更别谈中国创造了,呵呵。
也许创新是技术发展的灵魂,但皮之不存,毛将焉附?世界上本来就有多种发展途径,有google那样的cool brand,超前地进行用户体验,让人觉得酷而新奇,永远让人惊喜。也有百度这样的,以最大多数用户体验为基础的缓慢的养成和培育。创新不是横空出世,而是在旧有的体验上进行改造,综合与优化是最好的创新,从这个意义上来说,百度贴吧、知道等都是非常好的创新产品。
至于抄袭,本来都是搞同质竞争,如此相同的行业,想要苛求完全不同的产品,大概也是做梦。本来是两个公司之间的口水战,关键还是核心技术,这个是抄袭不来的。
至于技术,百度擅长的是中文搜索,从来也没有说要在英文搜索上跟google比较。说实话,百度的英文搜索和google的中文搜索一样烂。各有所长,百度又没有非要进军英语市场,google可是把手脚伸向中国,这可是田忌赛马了,高下立判。请各取所好,你想查阅英文或技术资料,请google,你想查阅中文信息和娱乐信息,请百度一下,没有人非要让舍此而取他呀?
说到个人品德什么的,这个扯太远了,没有证据的事情请都不要瞎猜。说百度阴google,觉得百度可能是吃了个哑巴亏。这种事情,绝对是,解释也是屎,不解释也是屎,以Robin Li的口才,说上三天还不如马云出来说半个小时。呵呵。谁又知道这是不是对手嫁祸百度的阴招?谷歌这次闹这么个大笑话,也没见百度落井下石,讥笑不已吧?保持对对手的尊重,是有度量的公司的起码条件,这一点似乎被有些人忘却了。
google是个让人喜欢的对手,这并不意味着,所有的GFANS也都如此。百度一直被妖魔化,让人纳闷。很多搞技术的骂起来简直不分青红皂白,坚持仇恨百度,似乎百度是什么的代名词,这真的是有些可怕了。不知道是仇富还是恨铁不成钢还是别的?理性地对待这两个公司的竞争,多点善意,多点宽容,也许是鸡饭和肚丝们最好的态度了,也真的该让人,清净清净了。
一一 —— 2006-05-08 @22:03
楼上的,前面评论里对百度是不是中国公司这个问题说得那么清楚了,你居然还以为百度不是中国公司?
我不得不说你才是sb
Q —— 2006-05-08 @22:09
以前天天来看keso的blog, 后来变成了3-4天一看,现在是一周一看,以后估计很少再来了。真是可惜!
作作 —— 2006-05-08 @22:24
to R
不知你是跟百度有仇还是跟我有仇
首先,我还没有确定百度是不是中国的,但楼上的已经解释的很清楚了。现在国内企业大部分都以引进外资为荣为本事,所以有外资的股份也实属见怪不怪的事,你还偏偏强调或者肯定百度就不是中国的。
其次,我只是赞成其话。关于这个我也没有好争的,你自己看看有好多网友都看不惯KESO了,更别说百度。
最后,建议你以后说话拿出个理由,不要没事乱咬!
断峰狼 —— 2006-05-08 @22:55
路过,从第一楼慢慢地看到最后,发现里面火药味十足,咱先不管它什么专利问题,外国企业与中国企业问题,还是上升到什么政治问题,客观的看一下keso的文章,里面提到了:本文只有疑问,没有结论。下面的一些人也申明找到了原文及一些证实方式,咱先不说这些,文章最后也声明了:另外,请大家有话好好说,不要互相攻击。可以看出keso是用很公正的态度来写完这遍文章.
只是希望大家心平气和的谈论自己的观点,只针对事不要搞人身攻击.
nu —— 2006-05-08 @23:32
近日,百度、Google两阵营又起纷争。Gfans暂时先声夺人。古人说道理越辩越明,不知道此次旧话重提有无新意结果出现。
详见:
百度七宗罪
Google和百度的中国式困惑
东拉西扯:超链分析和Pag…
只言片语的碎片 —— 2006-05-08 @23:35
给用户带来的多少利益才是权衡标准?
身为十大流氓软件的百度插件,倒是强奸了不少网民。
湿毒清 —— 2006-05-08 @23:43
是这样,你可以心平气和地说你一个平时你深恶痛绝的对手的谣言,这个谣言是你拿不准的,所以,只有慢条斯理,让人不要互相攻击。可惜keso同学抛出这个话题的用意已经很明确了:
“我知道这是个谣言,我拿不准,但我宁可相信它是事实。”
而且还有那么一大段含沙射影的话,联系到keso一贯的言论,如果他真的搞懂这个问题的话,口气恐怕就不是这么软弱和故作公允了。
立场是错的,一切都是错的。keso同学,应该爱惜你自己的羽毛。
一一 —— 2006-05-08 @23:51
Y. Li, “Beyond Relevance Ranking: Hyperlink Vector Voting,”
RIAO 97: Computer-Assisted Information Searching on
Internet, 1997, McGill University, Montreal, Canada, pp.
648–650.
Beyond Relevance Ranking: Hyperlink Vector Voting
Yanhong Li, Larry Rafsky
GARI Software/IDD Information Services,
1997,
TOWARD A QUALITATIVE SEARCHENGINE
YANHONG LI
GARI Software/IDD Information Services,
JULY • AUGUST 1998, Internet Computing.
我觉得李彦宏没抄google,但是也很难说google从李彦宏那里听去了idea,可能双方印证了一下,英雄所见略同吧, 这个idea也不是很难想到,文献检索中的引用(citation)几十年前就有了,关键是谁实现的好.
Mike —— 2006-05-09 @00:11
"这个会议的时间是1998年4月,地点是澳大利亚的布里斯班。如果没有搞错,这应该就是第七届国际WWW大会。" 那个workshop应该是比这个更早的会议,双方都没有成名的一个小workshop,我想是梁冬搞错了。keso直接问李彦宏吧。
Mike —— 2006-05-09 @00:35
1.那些骂KESO是垃圾的可以走远些,他真是垃圾你们在这里费什么劲?到底谁会跟垃圾费劲?
2.自我感觉KESO对百度的态度没那么阴暗,虽然他曾经被邀去GOOGLE总部访问。对自己不那么争气的孩子,中国人也老喜欢拿别人的孩子刺激他。但那毕竟是自己的孩子啊。
3.KESO写这个不知道花了多少时间,至少估计他没有预料到这文会引起这么大的动劲。以后如果还要发这样敏感的言论(你当然会发,不然你就不是KESO了,哈哈)建议多花些时间准备资料。毕竟事后的UPDATE不能完全弥补原文中的漏洞带来的影响
andy —— 2006-05-09 @00:55
就算Keso再可耻,咱们还是会来看他的
Baidu和Google都是这个理儿
KID —— 2006-05-09 @09:03
只是路过~
jacksl —— 2006-05-09 @01:30
难道是国内没有米国那么几百年的自由商业竞争,所以才导致‘谁的屁股都不干净’?
明明是自己可以不做的事情,何必要把理由加给客观呢。
好比现在的家长厌恶网吧和十年前家长厌恶游戏厅一样,难道自己的孩子一点错没有,都是网吧和游戏厅的错?
看到前些日子那个飞线主板的lenovo本本的消息,本来还对国货有点好感,现在全无了。lenovo的所有东西,今后都彻底被我打入冷宫了。
口碑不是一日两日能立的。还是那句:自作孽,不可活。
忘记说了,yahoo现在在我心目中的地位如同3721。
十口 —— 2006-05-09 @09:40
这个。谁能说的清啊。公说公,婆说婆
最佳阅读网
http://www.bestread.cn
最佳阅读网 —— 2006-05-09 @02:14
只有疑问,没有结论:
百度为什么收购Hao123?
只有疑问,没有结论:
Google为什么被控传播网络色情?
只有疑问,没有结论:
百度的插件为什么被人指为流氓软件?
只有疑问,没有结论:
Google为什么想以9千万美元了结点击欺诈官司?
只有疑问,没有结论:
为什么Keso只质疑百度而没有质疑Google?
vazi —— 2006-05-09 @10:21
yahoo把邮箱卖给zf那档子事足以证明yahoo是如何缺乏道义
cxna —— 2006-05-09 @10:48
观点太中立,就不会有观众。
海棠依旧 —— 2006-05-09 @03:45
今天在洪波的博客中看到一篇文章:超链分析和PageRank的专利问题,才第一次知道百度总裁李彦宏曾经申请并获得对于超链接分析的专利,我们姑且称之为超链分析专利。而这个专利申请是在G…
搜索引擎优化排名SEO每天一贴 —— 2006-05-09 @04:44
关于两个专利的关系:因为我很早就比较过这两个专利,所以冒昧指点一下迷津:
一句话,Y Li 专利的目的是解决"anchor text indexing" 问题, 而 L Page 提出的是一个与文本内容无关、完全基于超链接关系的 global doc ranking technique.
有一个问题关键在于:在1997年的时候,"anchor text indexing" 已经不是一个全新的idea, 早在1994年就已经有人使用并且在 WWW’94 会议上发表(used by the WWWW Worm)。因此 Y Li 专利的新颖性是存疑的。
无论如何,这两个技术都是当前任何一个 Web search engine 都必须使用的基础性技术。由于难以获得“专利侵权判据”,没有人会担心因为使用这些技术而被告侵权,只是他们不会说自己使用了它们。例如,没有人敢说自己使用了 PageRank (除了Google, of course),但是可以说是用了某种 link analysis technique…
A Pseudo SE Expert —— 2006-05-09 @13:28
Kesoһƪ½PageRankר⡷ͨƪ֤ٶϴDzdzϮLarry PageרϷ˱£ǿȥԽԽζKes……
Jan'uary —— 2006-05-09 @14:03
百度也该和你学学“脚踏实地”的道理啊~~
JasonIT —— 2006-05-09 @06:05
路过, 觉得这是一个商业操作, 科学技术是不会随着争论这些而进步的!?
oneandhalf —— 2006-05-09 @06:10
google翻译,简体中文翻成英文,输入百度,看看翻译结果。
我跟google写过信反映过,没有回应。平时比较喜欢用google,觉得google应该不屑用这种方法对竞争对手的,或许是个玩笑,但玩笑开的太大了吧。Don’t be evil,至少这个不是。
freesurfing —— 2006-05-09 @08:36
买了一本关于百度的书度假,看了几章,怕脏了自己的眼,扔垃圾堆里了(对天发誓是实话)。
bidu —— 2006-05-09 @16:50
两个专利性质完全不同,说抄袭有些可笑。Keso很客观的分析,并没有发表自己的立场,而有些人却开始人身攻击,对人不对事,实在没有风度。
我们不喜欢百度,是因为太多低级的做法,而且本身搜索技术就比Google差,搜出来结果多,排在最前面的却很少是有用的,如果真的Google抄袭了Baidu,怎会抄袭的如此出神入化呢?
象前面那位老兄说的,不管谁的专利,最后谁实现的最好,谁就是老大,就这么简单。李彦宏说别人抄他的,未免炒作的味道比较重,如果Google做的很烂,他会搬出来说Google抄他的吗?
jfish —— 2006-05-09 @08:53
Keso写的东拉西扯:超链分析和PageRank的专利问题,还真捅了马蜂窝,一大堆人在回复中说什么的都有,还上升到了爱国的高度,至于嘛??
我觉得作为一个中国人,一个炎黄子孙,应该没有…
E-space —— 2006-05-09 @08:58
看了gfans表现
我决定做一名百度粉
LL —— 2006-05-09 @17:44
建议Donews的开发人员改一下这个BLOG程序:
把发表留言的人的名字的颜色改一下,有link的名字用蓝色,没有留下网址的留言者的名字用灰色,或者干脆用背景色。
这样的好处就是:我们可以基本上判断哪些人说话不负责。
zola —— 2006-05-09 @18:10
caoz行不更名坐不改性,
多说无益,也不想嚼这个舌头
只说一句话
Google在中国遭封杀和百度没关系。
caoz —— 2006-05-09 @18:41
“Google在中国遭封杀和百度没关系。”这不符合“精英们”的期望,多说无益。但我坚信,CNN以前在中国遭封杀跟SINA没关系。
gsx —— 2006-05-09 @19:18
只不过百度成为最大受益者,因而顺理成章地也就成了最大嫌疑人而已。
zola —— 2006-05-09 @19:23
google的fans的确看起来素养较差,丢人哪!
asialion —— 2006-05-09 @20:19
google的fans的确看起来素养较差,丢人哪!
asialion —— 2006-05-09 @20:21
从 blogger 及传播的角度来说,能引起 N 多人群情激奋或参与的 post 就是好的 post,所以 keso 绝对是最好的 blogger 之一。
其它的,大家对 keso 的要求就不要那么高了吧。
lesliewei —— 2006-05-09 @20:22
<P><FONT face=Verdana color=#226ddd size=3>
<MARQUEE behavior=alternate><STRONG>支持百度!支持国货!</STRONG></MARQUEE></FONT></P>
aaa —— 2006-05-09 @21:25
这哥们搞的象和百度有仇似的!
jv —— 2006-05-09 @21:29
本来就是纯粹的技术讨论,楼上的百度fans们不拿出有力的证据出来,却诉诸政治,甚至人身攻击,实在令人鄙视。
卡卡鱼 —— 2006-05-09 @21:35
唉~动不动就fans fans得
是时髦还是幼稚?
hefa —— 2006-05-09 @22:18
先贤有曰:为人中庸
我承认google是个好东西,我整天用他的服务,首选邮箱gmail的
可我不是所谓的fans
我只崇拜一个人,那个人学识极高又淡薄商业
baidu是有很多问题,例如那个著名的“推广”
qq当年为了赢利还切断免费注册而用短信注册呢
都是为了赚钱,你不愿意用就不用呗,没有人拿枪逼你用
何必呢?何苦呢?
出名未必是好事
被人当作小丑,在传统观点看来不是什么值得庆幸的事情
hefa —— 2006-05-09 @22:23
有时间把donews的问题解决解决
已经有很多人把blog从donews转移了
人心散了,不好带了—— 一个donews5年用户的看法
hefa —— 2006-05-09 @22:24
似乎现在骂党骂国已经成了时尚.百度可怜,因为貌似与此有关,就成了IT届被攻击的对象.QQ可怜,因为本土,因为"下等网民"用得多,就成了"精英人士"鄙弃的对象.联想可怜,因为生在中国,即使收购了IBM也被讥笑为画虎不成反类犬.只要你是个中国人,只要你在中国做了点胆敢跟跨国公司挑战的事情,你就绝对成了笑柄和被辱骂的对象?为什么?因为你技术差!因为你在中国的统治下,因为你是黄颜色!
说的太好了,其实很多“精英”就是垃圾
小庸 —— 2006-05-09 @22:29
我不留链接,所以我说话不负责
这篇挺强的,我留个座位
一边倒的撕杀没看头,经典的戏,一定要双方你来我往的打,最好还有不明真相跟着瞎掺和的
当然也有些事情我搞不懂,好多中国人的脑子都是单极的,容不下性质相同的两件事物共同存在,所以剧终都是正义战胜了邪恶。如果世界上只剩下正义,那么正义也就是邪恶了
梦游客 —— 2006-05-09 @23:27
to gao:
没百度你就做不了网站了?没百度就没互联网了?
“封”?你的网站不能正常访问了?
你的牢骚很搞笑。
gsx —— 2006-05-10 @09:03
俺们小站长不管什么专利,只希望百度能对我们这些小站长公平些,别让俺们做出个像样的网站就能封掉,郁闷死了,今天刚做好了网站,才来了几千IP就封掉了,这是什么世道,最重要是别J8启用那些封杀专员,那些专员都发财了,现在百度上高流量的站谁不是他们在背后控制的,靠,一旦程序涉及到人为因素,就肯定造成这程序的失败,严重希望百度在这方面要改善,如果没能力的话至少要让那些所谓的封杀专业不定期更换,建议采用现有的考车跑长途的考官的方法,这样对任何人都公平,而且在封杀人员的上面最好设置一个监管部门,这部门不涉及封杀工作,只负责检查!
我们小站长只需要公平,别花了好几个月的心思弄个好站,流量来了,二天就能封掉,郁闷死了
gao —— 2006-05-10 @01:30
还是相信google些!
百度也不错,吵来吵去有点意思,这里有特务吗?!
听大家吵吵,或许也会有所启示,哈哈。。。
hot1.cn —— 2006-05-10 @02:07
评论更精彩。嘿嘿。我是G粉。
Ming —— 2006-05-10 @10:49
为波兰的罪过感到羞耻的人,就是波兰人
—— 波兰思想家米奇尼克,讲自己怎样成为一个爱国者和民族主义者
cvu —— 2006-05-10 @13:55
Keso最近发了一篇文章叫做《东拉西扯:超链分析和PageRank的专利问题》,通篇在论证百度老大李彦宏是不是抄袭Larry Page的专利。本来老夫看了标题饶有兴致,可是看下去越来越不是滋味。Keso号称自己只是摆数据,不评论,可笑的是文字中透露的那股鄙视百度的味。什么叫不评论?各位可以去看看Solidot的报道,再比较比较Keso的文字;不评论的文字也有两种,一种有感情色彩,一种没有感情色彩,不评论的文字同样可以影响读者的判断,玩这种文字游戏,是不是有点下流,还不如干干脆脆摆明了自己是baidu黑呢。
最最可笑的是做论证的时候去查李彦宏申请的专利号,居然拿Robin Li这个名字去查?查出来结果为0于是“几乎”得出结论说Robin Li是骗人的。哈哈,申请专利会用这种名字么?稍微有点脑子就知道专利申请人的名字应该和有效证件上的名字一样吧,中国人在美国的有效证件,八成是护照了。护照上是不会有Robin Li这种名字的。贻笑大方。
zz —— 2006-05-10 @19:19
keso肯定不是垃圾,从环保角度来看,垃圾是放错位置的能源。keso是服食了一枚叫做“谷哥”的迷幻药,产生了迫害妄想患者的某些症状,整体错位,所以所以看起来像垃圾。
实际上,我保证,keso正常情况下,是个爱国爱自己的好人:)
osek —— 2006-05-10 @21:37
<p> 首先,KESO发现了百度的创始人的确于1997年在美国申请过一项专利-超文本文档检索系统和方法(Hypertext document retrieval system and method),而后一年Google申请了PageRank专利,不过,这两项专利基本上是不太相关的,因此对于搜索引擎底层的PageRank技术,应该就没有谁抄袭谁的说法。</p><p> 其次,百度的支持者(或员工)透露百度股权“提供双重级别的普通股”,提供反恶意收购计划,即使绝大部分股权
月光博客 —— 2006-05-11 @00:30
一个专利是否重要,从引用率可以看出来。
Yanhong Li的US Patent(5,920,859, Hypertext document retrieval system and method), 申请时间是1997/2/5,批准时间为1999/7/6;到现在,已经被71个后来的搜索相关的US Patents引用。
Lawrence Page在Stanford的两项Patents(6,285,999, Method for node ranking in a linked database; 6,799,176, Method for scoring documents in a linked database); 申请时间分别为1998/1/9和2001/7/6,批准时间分别为2001/9/4和2004/9/28;到现在为止,被其它专利的引用次数分别是29和5。
另外,Lawrence Page的第二项专利中也引用了Yanhong Li的专利。
摆事实讲道理 —— 2006-05-11 @02:16
有人在keso的BLOG中匿名说道:
—————————————————–
说实话,百度是什么,外资还是中资,发明技术在前还是在后,一点不重要.重要的是,百度之所以成为百度,不管有没有原罪,不管如何,它正在努力成为一个最好的公司.
—————————————————–
流氓本质出来来:不管有没有原罪,不管如何——有七宗罪还是八宗罪。
百度显然是个流氓,并且是流氓中的老大。
zola —— 2006-05-12 @00:55
keso这篇文章写得相当不错啊,作为深度报道来说,相当不错;尤其难得的是keso自己还更正了疏漏之处。
keso的文章并没有谈到“爱国”与否的问题,而只是就事论事,做了一些考证;而后续网友留言讨论,一点点把整个事件扭转到“爱国”的高度,从而占领了道德的制高点,就再也看不到理性讨论。
我们每个人都会存在某种偏见。keso同样如此。所以我们才更需要理性讨论,以理服人;而占领道德制高点的招数,我看拿来讨论问题是屈才了,应该用去--以德治国。
麦田 —— 2006-05-12 @02:26
good article.
free trial software —— 2006-05-12 @15:11
有一个人号称oversea chinese , wakakak 英语貌似不咋地……
Awflasher —— 2006-05-12 @21:14
专利问题一般人说不清楚,愿意争可以去起诉么,不管在中国还是在美国。
最起码google的不做恶是大家有口皆碑的,百度呢? 只能以“流氓公司”来形容。买了百度的火爆地带,他们说改合同就改,通知都没有,要不是自己发现,还不知道要被骗多久。
判断一个公司的价值,不应该看他是哪个国家的,要看他是否真的为客户着想。
我支持google!
花样年华 —— 2006-05-13 @01:25
donews里小人太多,应该请何勇来为这里演唱主题曲。
fei —— 2006-05-13 @11:02
谁受谁的启发不重要,不管怎样谁不是受前人的理论启发的。受启发总比陈进的造假来得强。百度在中国怎么说也是靠技术和实力起家,相比3721等等耍流氓来得强。
Neo —— 2006-05-13 @22:52
没有必要继续深入研究, 这是一篇引人入胜的文章.
fobs —— 2006-05-14 @15:39
补充说明一些问题。
本次统计截止到名为fei的留言。
考虑到每次留言意义不同,本次统计按留言条数计算,没有按留言id数统计。另外,把外部链接的相关帖子也算作留言。
间或有统计错误,间或有逻辑错误。
图片中黄色框框中的内容均为精彩的有特色的留言内容,也有个别是为写帖子举例用。现在看没用上。明天把这些有特色的留言贴出来。
一个印象,中立立场的留言在澄清问题上最有效力。
另一个印象,不管你多正确,争论不能改变别人。需要有更好的策略和态度。
第三个印象,如果认真、冷静,分辨是非对错不难。如果不太认真,也不够理性,也很容易迷失,尤其对于外行。我自己就是最好的例子。…
旧烟斗 —— 2006-05-15 @21:46
李彦宏、丁磊这些人低调躲开国内媒体是有道理的。
IT江湖险恶,远小人近君子,省得被人背后捅了都不知道是为了啥。
marketiva —— 2006-05-18 @15:31
呵呵,Keso这里的评论快赶上slashdot了。
DemonFox —— 2006-05-21 @06:57
it已经够娱乐化了,还谨防。
donews早已是娱乐代表了。
trow —— 2006-05-22 @17:39
"请大家有话好好说,不要互相攻击。"
比较充分地反应了网民的素质。
trow —— 2006-05-22 @18:03
很简单。
keso和google关系好,别人google,李开复估计给他带来了不少的利益,而百度总裁估计得罪了keso,没有给他好处。
keso的确是非常有见地的聪明人,再在google的帮助下,成为博客第一人,也很正常。
keso帮帮google说话,贬低百度。当然是利益的驱动。但若追逐利益而蔑视道德,客观,公正。那么,只能算是小人。
网民的利益很清楚:就是需要像百度这样的公司,来抵制美国的垄断。
否则,我们不知道又有多少网民的血汗,会被,
美国,外国人吸走(就像微软的垄断一样)。
而聪明的keso,的确,被你的聪明,追逐利益的
嘴脸,蒙蔽。
但是,我想,说说也好,商战不是说,就能说
跨一个企业的,对一个企业未必坏事。
VIP —— 2006-05-24 @05:23
时间可以证明一切
无名 —— 2006-06-02 @20:00
http://spaces.msn.com/liuyi/blog/cns!92181235BE2294E3!245.entry
Liuyi —— 2006-06-04 @00:40
“超链分析”比“PageRank”更能体现web2.0思想
正如samuel的《“超链分析”和“PageRank”专利的分析比较》一文所述,两者是不同的两种技术。
“超链分析”,它综合了“查询关键词”和被查询文档的“链接锚关键字”,关键字最匹配的排名靠前。
而“PageRank”的排名以被查询文档的链接数作为指标,并不涉及“链接锚关键字”。
这里讨论“链接锚关键字”的意义:
简单来说,就是页面A中有一个带下划线的文字,例如JAVA,点击JAVA可以链接到页面B。
那么对于页面B来说,其“链接锚关键字”中就含有JAVA。
这样,在用户查询JAVA的时候,页面B就更匹配一些,排名考前。
“链接锚关键字”类似与Tag的概念,不但是页面A的撰写者自定义的关键字,而且能够代表页面B的主要特征。
从这个意义上来说,“超链分析”能体现web2.0的思想。
另,时间原因,本人未阅读相关专利文献原文,仅参考samuel的分析给出上述推断。
仅代表个人观点,就事论事,不倾向于任何一方。有说得不对的地方,请大家指出。
汗~,非注册用户不能使用引用功能,版主把我前边两篇不成功的删掉吧。
Liuyi —— 2006-06-04 @00:56
纯转
Explorering —— 2006-06-13 @10:06
QQ可怜,因为本土,因为"下等网民"用得多,就成了"精英人士"鄙弃的对象.
在中国,就会这样.
湖北圈 —— 2006-06-26 @22:17
为什么那么吵呢?
喜欢什么用什么!
我用google搜索网页,用baidu搜索图片和音乐,
用英文yahoo来搜视频,用go2map来搜地图。
哪个好用哪个,和乐而不为呢!!!!
orlando —— 2006-08-28 @10:26
孰是孰非,请查阅对比相关专利文档再说,别在这里凭主观意愿说话!另,佩服李彦宏和Larry,即是技术高手,又是资本运作高手!
continue —— 2006-09-14 @09:32
在这里大言不惭的勇士们,你们有勇气用真名说话么.不管说的好坏,都是经过考证的.脱口而出的狂言只是你素质的证明.
素质知道,证明了一切.
虾米 —— 2006-12-20 @09:59
your blog is very nice
gdieboss —— 2007-02-19 @17:20
做人及做事,做事及做人
dongdonglang —— 2008-03-14 @15:32
做人及做事,做事及做人
dongdonglang —— 2008-03-14 @15:32
做人及做事,做事及做人
dongdonglang —— 2008-03-14 @15:32
做人及做事,做事及做人
dongdonglang —— 2008-03-14 @15:32
做人及做事,做事及做人
dongdonglang —— 2008-03-14 @15:33
只崇拜D.E.Knuth 那那些垃圾去吵吧
deknuth —— 2008-03-14 @17:28
来研究下,还是没结论。
liulei —— 2009-03-23 @19:37
??????????????? « ??????????????????
匿名 —— 2009-04-22 @13:50
其实百度真的很厉害,商场就是一个没硝烟的战场,我也不是百度的托,看看你们骂百度,至于百度怎么样也不是你我说怎么样就怎么样了,试想一下,要是你们处在李彦宏的位置,你能把百度带成今天的这样?你能做到在舆论上一点负面都没?要是你能做到的话,我叫你爷爷!李彦宏很值得钦佩,为什么这样说呢,当国外人一听到百度都想到我们中国。李彦宏把百度做出了一个值得中国人骄傲的互连网品牌。
悟! —— 2009-05-19 @09:36
现在看这些评论真是感慨万千,google这两年真是不容易,不过,google代表着未来
恶6 —— 2009-06-30 @23:54