demo@virushuo

不知道叫什么名字,不过感觉demo也好。虽然人生没有彩排。

My Links

Blog统计

公告

about me:
about me
CC License. Some rights reserved.
本站之所有未作特别说明的内容均使用创作共用协议
署名·非商业用途·保持一致
gtalk:virushuo
skype:virushuo
my filckr
银杏站内搜索




文章

收藏

相册

5G评论组

推荐看

支持!

存档


正在读取评论……
如果有人作一个包含2,147,483,647个页面的网站,目的是用来做搜索引擎的机器人行为研究,你是不是觉得他疯了?

1年前,真的有人这么做了。大家现在差不多忘了这档子事,这哥们又冒出来了,这次还带来了一份报告,他还真把这事情作成了: http://drunkmenworkhere.org/219

既然作成了,就值得看看了。我以前曾经说过,抓取这事情不是那么简单的,如何能按最合适的频率抓取数据,也是一个很好的数学模型。国内的百度,搜狗之类,显然这个就没作好。

要是能搞个中文的机器人分析,肯定很有趣。百度那样的疯狂死抓法,作出来的图样会不会有一种变态的美呢?

Trackback: http://tb.donews.net/TrackBack.aspx?PostId=861208


[点击此处收藏本文]  发表于2006年05月09日 2:11 AM




正在读取评论……
大名
网址
验证码
评论