前注:一位以中学生为阅读对象的杂志编辑,我的Blog的读者向约稿,题目是介绍搜索引擎。传道授业解惑,非常严肃崇高的事情,也是我一直的梦想。不过要是写不好,就祸害了祖国的花朵!诚恐诚恐中,套用他杂志文章的格式,写了如下文字。
--------------------------------------------------------------------------------------------------------------------------------------------------
什么是搜索引擎?英文(search engines),简单地讲,指的是在后台用各种技术和方式对互联网上的信息资源进行搜集整理,然后供你“检索”信息的一个系统。它包括信息搜集、信息整理和用户查询三部分。形象的比喻他的功能,就是一个“你问我答”的系统,如同过去的十万个为什么,它可以给你答案,而且不唯一。他的总得条数远大于十万个,网络上有的,他就能回答你;网络上已经删除网页内容,找答案的时候它也可能从它的历史记忆库中为你重新提交过来。这时候的你或许的疑惑就是“它什么能找到答案而且是那么多答案呢”,别着急,下面我简单介绍他的原理和历史。
搜索引擎最早时候有点象我们去图书馆借书时候的索引区,把书根据内容分类,后根据其拼音字母再排序。互联网刚开始的时候,为了便于大家查找内容,有人就把网络上面的内容和此类似的进行分们别类,然后根据其字母进行排序。大家找需要的信息时候,根据信息的类别,一层一层点击进去,最后找到自己的答案,这也就是最早的搜索引擎模型。然而随着互联网信息按指数倍的增长,分类的工作已经无法同步跟上新内容网页的变化,并且分类的困难也越来越大。这时候,就出现了带有点智能意义的搜索引擎,互联网,顾名知意,就是互相通过地址连起来的一个网,新的智能搜索引擎通过一种程序〔程序员称之:机器人Robot〕,这程序自动会顺着互联网的地址,去记录所有地址网站上每一页的标题字〔程序员称之:关键字〕、网站的位置、网站的名称等,然后记录其对应的地址,把这些东西放入一个数据库。这样子,当你查询内容的时候,它就会根据信息相关的内容,还有这些内容与你查询内容的匹配程度、被查询的频率等,从本地数据库中找出来,一下都罗列在你的眼前。这时候,你可以在这么很小的范围中,在一些比较靠近你问题的答案中,通过自己的比较和判断,找到你所要的相对最佳解答了。比起人工的排列,智能的搜索引擎通过计算机全自动的收集、存储、查找,实现了搜索效率的优化,而优化的核心,就是计算你的问题答案的匹配度的程序。这最核心的是算法,在大学的计算机专业课程中,《离散数学》就是一门教你什么样在网状的连接中最有效率找到你答案的一门课程。
目前,在国内,比较有名的搜索引擎是百度,他的特点是很中国化,很多人通过它去查找自己喜欢的音乐,在中文检索方面有较高的准确率;还有古狗,它在职业人士中用的比较多,他的特点是界面很简洁,搜索的速度比较快,英文的检索准确率很高;还有新浪网的爱问〔Iask〕,它的特点是如果结果中有图,它会直接给你显示出来,比较直观。其它下面有列举,篇幅所限,不再一一列举,请大家根据实际体验情况自己选择。
搜索引擎如今已经成为很多人工作中的必备,生活中的助手,离开了它,在碰到问题的时候,不知道该如何寻找答案。今天我也是通过搜索引擎的帮助,校对了一些专业词汇。你呢?是不是也开始准备向它问十万个为什么呢?
编者按•特别链接:国内六家有代表性的搜索服务站点
百度:www.baidu.com
古狗:www.google.com
新浪爱问:www.iask.com
搜狐搜狗:www.sogou.com
雅虎:www.yahoo.com
中搜: www.zhongsou.com
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=720152