上午在Bloglines上浏览订阅的blog,本来用得好好的,忽然就无法访问了,显示超时。
The connection has timed out
The server at www.bloglines.com is taking too long to respond.
通过代理服务器可以正常访问,随后询问了几个网通用户,都表示不能访问,而中国电信和联通的用户却可以正常访问。这种状况持续了大约1个多小时,11:10AM,访问恢复。恢复访问后,我做的第一件事,就是赶紧导出我的feeds,我知道,这是一个必须建立的好习惯,因为这事儿让我对国外的服务越来越没信心。
Bloglines几乎成为我赖以活命的工具,它对我的意义跟粮食差不多。如果Bloglines真的被封了,我会疯了。这样一想,不免心有余悸。国外越是好的服务,被封的风险越大。就像老白说的,“Technorati的死掉、Google的‘连接被重置’,都让我看到了作为一个中国IT工作者的信心。”
有些同志有信心封掉一切可能的风险,是因为有些同志对中国的网民没信心。我们总是以最没有信心的方式,来表现我们的信心。或许有一天,当中国网民对所有国外的服务都不再有信心,一定会有人因此自信心爆棚。这几乎是一定的。




咿!?今天板儿砖来做一次沙发
keso的粉丝们都跑哪去了?中午13点了呢!!!
板儿砖 —— 2006-07-06 @12:44
keso无可救药的人品问题啊
tinyfool —— 2006-07-06 @12:49
还是用GreatNews同步吧
盗 —— 2006-07-06 @12:56
让中国网民都自娱自乐吧
riku —— 2006-07-06 @13:10
杯弓蛇影
惊弓之鸟
草木皆兵
一朝被蛇咬 ……
windrose —— 2006-07-06 @13:31
keso的粉丝在这儿!!!!!!!!!
棋迷网棋迷网 —— 2006-07-06 @13:37
1、大家都去学习“八荣八耻”“文明办网”去了;
2、大家看了今天凌晨的球赛;
3、其他原因
贤思齐 —— 2006-07-06 @13:43
只有一声叹息阿
java —— 2006-07-06 @14:59
呵呵,改变生活习惯啊…
用国内的产品啊,虽然不是非常好用,但应该还足够满足生活需求吧…
电子商务 —— 2006-07-06 @15:44
我现在几乎所有的工作都在google上完成,用calandar安排工作流程,用googlenote搜集资料、打草稿,用group和合作者讨论工作进程。所有的工作资料都在gmail内。以后还准备用writely做平台。
那天万一google出了问题……sigh!
封印印象 —— 2006-07-06 @15:52
有道理,也可以这么说,
作人作不成,作猪应该还足够吧,作狗也应该足够吧
匿名 —— 2006-07-06 @16:00
首创的这个人太牛了吧??被Google收录55亿以上页面!!
以下内容来自6.18日幻灭网(kenwong.cn)的blog。(有标注和图片链接)
如何在18天内让Google收录超过55亿个网页
今天这个新闻成为了热点,同时也让人感到非常吃惊。这也许是有史以来最成功的Spam个案,因为它成功地骗过了Google,让Google在18天内收录了它的超过55亿个网页。这是一个前所未有的例子,同时也对Google的形象造成了一定的影响。那么到底是谁这么厉害,用什么样的方法做到这一点的呢?下面我们一起来看一下实现的方法。
根据Monetize(via digg)的报道,下面这两个网站被Google收录的网页数量达到了惊人的几十亿:
直接点击这里看站点一的Google收录结果
直接点击这里看站点二的Google收录结果
[红心注:以上站点已被google屏蔽]
要提醒一下的是,点击上面的链接时,每个人返回的结果数并不一定相同,这是因为每个人访问的Google数据中心不一定相同。但结果都是十分惊人的。为了保存记录,我截了两个图:
这是站点一的收录结果,接近24亿个。
这是站点二的收录结果,少一些,但也接近20亿个。
根据数据中心的结果的不同,以上两个站点能查询到的Google收录数量分别最多可达55亿个和24亿个。当然,不排除这件事曝光后Google会对这个站采取行动,估计以后查询的话,结果数量会更少。
然而更令人吃惊的是上面的两个站点的域名都只有18天历史,也就是说这两个站在3个星期内,就已经被Google收录了几十亿个网页。更不可思议的是,这两个站点的拥有者为同一个人,并且站点的每个网页上竟然都投放着Google AdSense广告!(写到这里,我再次打开这两个站点,却找不到AdSense广告了,因为站点被曝光后站长已经快速地撤走了所有广告,但之前的确是有的)可想而知这两个站点已经从Google手里赚走了多少广告费。
那么到底这种超级Spam是怎样实现的呢?下面是大概的方法:
1.注册一个无意义的域名,域名由数字、字母及特定符号组成。注册多一些,比如100个;
2.用服务器把这些域名及相关的子域名管理起来。为域名建立尽可能多的子域名。当然,你需要一个足够强大的服务器,因为在接下来的几个星期里,它将要承受巨大的访问压力;
3.弄来尽可能多的文章数据库。不管你是采集还是用钱买的,尽量弄多一些,至于内容是什么并不重要。最好把这些数据库中的某些字符替换成相应的ASCII码,这样就不会被搜索引擎认为是重复的内容;
4.自己编写或购买一个特定的脚本。这个脚本的作用是用来返回不同关键词的相关结果,并且有效地让数据库的内容分配到不同的子域名里。这个脚本应该能应付所有的查询。并且在服务器里设置所有的子域名都自动转向域名主页,并且由这个脚本决定显示的内容。并且你还要为这些子域名创建无限多的子域名,比如abc.xyz.com,变成123.abc.xyz.com。这是为了欺骗Google,因为Google(或者MSN、Yahoo!等)都认为一个子域名是一个新站点。这一点是成功的关键,如果你自己没有这种能力,那么最好出钱叫别人做。由于某些原因,这里只写大概。
5.发动blog评论spam攻势。把你的子域名遍布尽可能多的blog或其它网站;
6.等待几个星期,你将会有惊喜。
上面例子中的站点可谓超级垃圾站,并且Google没能成功地识别这是一种Spam行为,反而收录了它的几十亿个网页。相比国内的一些单纯通过采集数据而建立起的垃圾站而言,这两个站的站长就聪明得多了。但无论如何,这种行为都是应该要受到所有搜索引擎的惩罚才行,否则对于广大正规做站的站长而言,是极不公平的行为。同时这种行为也会极大地损害Google在用户心里的形象,破坏用户对Google的信赖感。
我的估计是这两个站很快就会被Google处以极刑。当然,与Spam站点作斗争是所有搜索引擎共同面对的任务,这是一个漫长的过程。但作为普通用户,我们更希望的是包括Google在内的搜索引擎可以提高识别垃圾站的能力,净化搜索结果,提高准确度。
内容全部见 http://www.rjkc.cn/post/77.html
anysook —— 2006-07-06 @16:33
呵呵,查看网页我用最原始的方法,我经常性地备份我的收藏夹。
好的资料就未拷贝下来,或者干脆摘录到博客上。
其实大部分信息会随时间的流逝而失去大部分价值。
maqingxi —— 2006-07-06 @17:34
连接被重置,最烦这个东西
nings —— 2006-07-06 @17:42
今天MSN连接不畅,有同样的原因吗?
zxy —— 2006-07-06 @17:44
树大招风。
魔高一尺,道高一丈。
不要害怕。
小发 —— 2006-07-06 @17:44
bloglines今天是遇到了这一问题,msn上午也时断时续。
不用bloglines,要是只能用国内的,哪用谁的好?以前用过gougou,不知现在怎么样。
野草 —— 2006-07-06 @18:17
为什么不用离线的Greatnews呢?
我觉得很好使啊
速度也快
而且跟bloglines能同步
。。。。。。。。。。。
想不明白
那小李 —— 2006-07-06 @19:06
用blogline主要是可以看一些被gfw盾掉的东西。。。。
小发 —— 2006-07-06 @19:35
跟我上次的情况一样,不一样的是:当许多人都不封的时候我只能认为自己疯了,所以赶紧删了帖子,以免被人发现自己不正常。呵呵
keven —— 2006-07-06 @20:10
不让我们有“粮食”吃,掀翻他们的吉普车!!
阿胜阿广 —— 2006-07-06 @21:13
不知道keso去不去天涯这样的地方,这两天天涯以及和天涯齐名的BBS都被毁了,限制每天发贴总量,限制回帖总量到100,100,我还清楚的记得曾经40000多回复的热帖.至此,我觉得中国的互联网风波到此应该算一个里程碑了,今后还能有什么?我想实名制已经不远了,今后上网要和蹬3轮的一样,胸前有个牌子表明身份才行啊!
pretender —— 2006-07-06 @21:19
请问bloglines如何导出feeds?
找了半天没有找到
匿名 —— 2006-07-06 @21:22
不好意思,今天才知道www.bloglines.com这个网站,发觉上面没有中文简体,呵呵,他们可能都不愿意开拓中文市场了。
green tea time —— 2006-07-06 @21:49
“Bloglines几乎成为我赖以活命的工具,它对我的意义跟粮食差不多。”
我听了有点儿想笑,建议Keso赶快交钱给Bloglines.免费的午餐总是免不了要担心的。谁让它免费呢。
正如不交钱用盗版Windows,被黑了拉倒。
交钱交钱交钱!!!!
vazi —— 2006-07-06 @21:57
我通过上海电信上网,在我这里Bloglines出问题已经一个多礼拜了,左面的tree出不来。
dodo —— 2006-07-06 @23:35
这是剑桥研究人员对GFW的研究报告,不知道keso读过没有?
http://www.computerworld.com.au/index.php/id;681916559;fp;16;fpid;0
http://www.cl.cam.ac.uk/~rnc1/
完整的paper:
http://www.cl.cam.ac.uk/~rnc1/ignoring.pdf
deng —— 2006-07-07 @00:50
Bloglines真的出问题了:(
全球中文博客网 —— 2006-07-07 @01:02
昨天上午发生的最恐怖的事情是无法解析所有 register.com 上注册的域名, 比 bloglines 出问题吓人多了。 bloglines 无法访问只不过是少看一天新闻而已,而且还有 tor 这样的工具,域名无法解析意味着好几个小时无数 email 受影响
qyb —— 2006-07-07 @09:14
"Technorati的死掉、Google的‘连接被重置’,都让我看到了作为一个中国IT工作者的信心。"
这句话说得很深刻啊.
silentnow —— 2006-07-07 @09:27
有些同志有信心封掉一切可能的风险,是因为有些同志对中国的网民没信心。
==================
问题:
你凭什么对“中国网民”有信心?
这信心来源是什么?仅仅是一种类似宗教的信仰么?
测试 —— 2006-07-07 @09:50
fuck
封个鸡毛啊.
把中国墙干掉! —— 2006-07-07 @10:40
如果哪天del.icio.us出了问题,恐怕我也没粮食吃了.
信心是自己给自己的.
没信心的人喜欢修城墙,有信心的人会飞跃城墙.
blogsir —— 2006-07-07 @06:48
傻瓜才用 online reader.
顺便fack 一下GCD.
ac —— 2006-07-07 @15:05
傻瓜才用 online reader.
顺便fack 一下GCD.
ac —— 2006-07-07 @15:05
bloglines怎么导出feeds啊??
xuyz —— 2006-07-07 @15:21
外战时卖推车,内战时卖麻袋,中国自古不缺人才.
cyberblue —— 2006-07-07 @08:45
粉丝在此~
魏天星 —— 2006-07-07 @08:49
应该学会适应
说多无益
伤口 —— 2006-07-07 @08:55
干嘛非要用在线的阅读器呢?想不明白
rgb —— 2006-07-08 @00:40
可以用Google Reader啊,最近的Google Reader更新不错。
aa —— 2006-07-08 @23:06