2006年09月03日

一个朋友的问卷调查,如果有时间大家帮忙做一下!

当代大学生的道德现状问卷调查

您的答卷是对社会的关心,是对师弟师妹们的关爱!

希望您能够如实回答

 所属专业       性  别     民  族   

 政治面貌          籍  贯                

 

(注:以下题目请答卷者认真填写,把每题您认为最佳的答案(只能选择其一)填写在答题卡上,若对以下题目有其他意见或建议,请把您的宝贵意见填写在各题目旁的选项(A)横线上。)

 

1、您爱父母吗?A                    

 (1)爱,父母是我生命中不可缺少的

 (2)一般

 (3)反感

  4)当我需要他们时就爱,当我不需要他们时希望他们远离

2、当面临家庭困难,您和您的弟弟(妹妹)都在念书时,您将怎么办?A                    

 (1)主动减轻家庭困难,学会自食其力

 (2)听天由命

 (3)为了减轻家庭困难,要不择手段

  4)为了减轻家庭困难,向国家或学校申请援助

3、在外读书,您一般多长时间打一次电话回家?A                    

 (1)每周一次

 (2)每月一次

 (3)时间不定,但不会超过两个月

 (4)一般不打,等家里人打过来

4、做人的本分是要孝敬父母,您做到了吗?A                    

 (1)做到了

 (2)一般

 (3)根据自己的情绪

 (4)没有人告诉过我这个问题

5、您主要的经济来源?A                    

 (1)家庭供给

 (2)靠国家的助学贷款和勤工助学

 (3)靠自己勤奋学习拿奖学金

  4)自己筹集,只要可以挣钱什么事我都干(包括做情人)

6、对于父母的苦口婆心,您会怎么做?A                     

 (1)不理睬,认为你们之间有代沟

 (2)完全听从他们的安排

 (3)用他们的话勉励自己

  4)只是听听而已

7、您认为目前孩子在家庭中处于怎样的地位?A                    

 (1)主动地位,充分发展自我个性

 (2)被动地位,一切听从父母安排

 (3)以上两者兼而有之

  4)孩子是家庭中的主宰

8、您对校园中的“课桌文化”有何看法?A                    

 (1)蛮不错的,有品味

 (2)视而不见

 (3)没什么大不了,我也干过

 (4)自己从来没做过

9、当您借到一本被污损的图书时,你的反应如何?A                    

 (1)公家的书就是这样

 (2)没什么,自己也曾这样做过

 (3)设法把书弄干净

  4)我非常注意保洁,别人我管不了

10、作为大学生,您读过《弟子规》吗?A                    

 (1)没有

 (2)只是看看而已

 (3)它是一本非常好的书

4)我正在照着做

11、假如您是一名教师,你更希望什么?A                    

 (1)始终保持老师的威严

 (2)绝对与学生打成一片

 (3)做学生的良师益友

4)做学生的楷模

12、快要下雨了,同学衣服还晒在外面,这时您会怎么办?A                    

 (1)不会多管闲事

 (2)主动帮同学收回来

 (3)根据心情好坏而定

4)认识的管,不认识的不管

13、您对考试时的作弊行为有何看法?A                    

 (1)为了考高分,可以理解

 (2)总比补考好吧

 (3)没什么大不了,我也干过

4)反感,自己从来不作弊

14、作为一名大学生,您做到处处尊敬他人(不论贫富)吗?A                    

 (1)做到了

 (2)一般

 (3)根据自己的情绪

4)没有人告诉过我这个问题

15、对待本职工作,您的态度是什么?A                    

 (1)兢兢业业,力求完美

 (2)不求有功,但求无过

 (3)视个人的兴趣而定

4)别人怎样我就怎样

16、如果您工作了,您对待单位同事工作上的失误,会持何种态度?A                    

 (1)充当“老好人”

 (2)一味指责挖苦

 (3)与同事齐心协力弥补失误

4)跟我没有关系

17、您认为恪守职业道德最关键的是什么?A                    

 (1)做好本职工作

 (2)充分发挥自身优势,不断创新

 (3)发扬团队精神

  4)向老同志学习,不断的纠正自己的过失

18、对于下属的迟到或早退行为,你将采取何种做法?A                    

 (1)睁一只眼闭一只眼

 (2)严厉斥责并扣发工资奖金

 (3)视心情好坏而定

 (4)找其谈心,端正他的工作态度

19、当您的建议被上司否定时,您将怎么做?A                    

 (1)立即放弃

 (2)私下说服上司采纳

 (3)以后不在提建议

4)继续完善

20、当您发现被朋友欺骗时,您会怎么办?A                    

 (1)立即断交

 (2)以彼之道还治彼身

 (3)争取挽回的余地

  4)到处败坏他

5)反思自己的过失

21、您积极参加集体活动吗?A                    

 (1)是

 (2)不,参加集体活动是在耽误时间

 (3)分情况,对我以后发展有影响的就去

  4)看我个人的兴趣

22、您积极参加集体组织的劳动吗?A                    

 (1)是,而且非常卖力气

 (2)不,因为我在自己家都不劳动

 (3)分情况

  4)去,但能少干就少干

23、您在交朋友时有原则吗?A                    

 (1)有,凡是互相能够信任、爱护、帮助的我就交往

 (2)没有,大家玩的来就行

 (3)凡是对我有用的人我就交往

  4)交朋友要看他的家教或所受的教育如何在决定

24、当今的大学生在没有结婚以前就与异性发生关系,您能娶她(嫁他)或接受吗?A          

 (1)能接受,但不想娶她(嫁他)

 (2)不能接受

 (3)无所谓

  4)我可以这样,但我不喜欢我要聚她(嫁他)的这个人是这样的

25、您对公共场所中长流水、长明灯的看法是什么?A                    

 (1)主动去关掉

 (2)视而不见,谁爱管谁管

 (3)没什么大不了,我也做过

  4)我从来不做,别人做我也不管

26、作为一名大学生,您认为环境保护跟您有什么关系吗?A                     

 (1)关系非常密切

 (2)一般

 (3)根据自己的情绪

 (4)没有想过这个问题

27、您认为地球环境的变化跟您有什么关系吗?A                    

 (1)有关系,但说不清楚

 (2)没关系

 (3)有关系,地球与我们人类是一体的,我们应该爱护和保护他

 (4)有关系,人类是毁灭地球的罪魁祸首

28、您是否抵制使用一次性筷子?A                    

 (1)是

 (2)没有

 (3)没想过

 (4)根本没有必要

29、在公共汽车上见到老弱病残幼,您是否会主动让座?A                        

 (1)假装没看见

 (2)别人不让我也不让

 (3)主动让座

  4)谁先座就是谁的,从来就没想让

30、您外出遇到红灯时,将怎么做?A                    

 (1)经常闯红灯

 (2)警察在时遵守交通法规,警察不在时不遵守

 (3)一贯遵守交通法规

  4)随大家的习惯

31、您认为决定青少年社会公德意识的主要因素是什么?A                    

 (1)社会环境

 (2)家庭陶冶

 (3)学校教育

 (4)成人表率

 (5)舆论导向

 (6)影视作品

32、目睹公共场合下一对恋人的亲热行为,您会持何种态度?A                    

 (1)赞同,自己也曾经有过

 (2)反感,认为有伤大雅

 (3)无所谓

  4)这是社会发展的趋势

33、您认为未来社会更会趋于哪一方向?A                    

 (1)法治社会

 (2)德治社会

 (3)以上两者互补

  4)没有想过

34、目前我国公民的道德现状怎样?A                    

 (1)很好

 (2)一般

 (3)较差

  4)没有想过

35、您认为道德对公民的制约作用如何?A                    

 (1)作用很大

 (2)作用在逐渐弱化

 (3)没有任何作用

  4)没有想过

36、您知道伦理道德的含义吗?A                    

 (1)知道

 (2)不知道

 (3)我根本就没有想过

  4)总这样说,但是没有人教过

37、您是否考虑过国家与个人的关系?A                     

 (1)考虑过

 (2)没有

 (3)偶尔想想,但说不清楚

 (4)这个关系非常重要

38、作为一名大学生,在个人利益和集体利益发生冲突时,你会如何决择?A                    

1)个人利益在前

 (2)集体利益在前

 (3)国家与个人都不能忽略

 (4)没想过

39、您为什么要入党?A                    

 (1)为了党的最高宗旨

 (2)为了自己以后的发展

 (3)我根本就不想入党

  4)没什么想法,因为自己也不错,别人有的我也要有

40、当看到有人乱扔果皮纸屑时,您会怎么做?A                      

 (1)自己捡起来扔进垃圾箱

 (2)上前制止

 (3)多一事不如少一事

  4)我自己也经常这样做

41、教室地面上粘有许多口香糖残渣,您认为这是什么原因?A                     

 (1)习惯成自然

 (2)我也干过,不吐咋办,也不能吞下去

 (3)垃圾箱太难找

  4)我非常注意,从来不乱吐

42、您在网上聊天时注意文明用语吗?A                     

 (1)从来不上网

 (2)上网时从不聊天

 (3)不太注意,因为大家都不文明

 (4)非常注意

43、您认为网络带给人们的影响是什么?A                    

 (1)正面影响大于负面影响

 (2)负面影响大于正面影响

 (3)没有影响

 (4)说不清

44、大学期间,电脑游戏是否会影响您的学习?A                    

 (1)是

 (2)否

 (3)说不清

 (4)从未玩过

45、大学期间,您在网吧呆过通宵吗?A                     

 (1)没有

 (2)偶尔也去过

 (3)经常去

 (4)从未去过

46、不论现在还是将来,您能作到处处尊敬教过您的老师吗?A                    

 (1

 (2)一般

 (3)根据老师层次的高低

 (4)他必须是我认为值得尊敬的人

47、您经常乱丢垃圾或随地乱吐痰吗?A                    

 (1)经常

 (2)有时注意,但已经习惯了

 (3)在有认识人的面前注意

  4)我从来不乱丢垃圾或随地乱吐痰

48、您对本次道德现状问卷调查有何看法?A                    

 (1)很好,而且很有必要

 (2)一般化

 (3)可有可无

 (4)根本没有必要

答 题 卡

1

 

2

 

3

 

4

 

5

 

6

 

7

 

8

 

9

 

10

 

11

 

12

 

13

 

14

 

15

 

16

 

17

 

18

 

19

 

20

 

21

 

22

 

23

 

24

 

25

 

26

 

27

 

28

 

29

 

30

 

31

 

32

 

33

 

34

 

35

 

36

 

37

 

38

 

39

 

40

 

41

 

42

 

43

 

44

 

45

 

46

 

47

 

48

 

49

 

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

备注:为了国家的昌盛,为了您和您子孙后代的发展,您认为当今的社会风气应该如何治理?

谢谢您的参与!希望有什么想法经常与我们联系。

E-maillilizong(at)gmail.com,

 

2006年08月31日

 

 

2006年08月16日

www.putclub.com (bbs.putclass.com)

一个不错的网站,上面有大量的英语学习资料,可以练习听力。

另外可以在上面下载语音复读机,下面是它的界面,简单易用,花20RMB,就可以注册啦,当然不注册也不影响正常的使用。

还有大量语音学习资料。找了好久的日语学习资料居然就在上面。

 

 

2006年08月03日

本体研究及其应用进展

李健康, 张春辉

本文从本体论的概念演变、理论体系研究、相关标准、研究应用情况及其发展前景等方面做一概要性介绍。

1  本体论概念演变

简单介绍了,本体的演变过程。并介绍了由Gruber 提出的: “ 本体是概念化的明确的规范说明Studer 对本体诸多定义进行概括分析后认为, 本体论的概念包括四个主要方面:

(1) 概念化(conceptualization) : 客观世界现象的抽象模型, 其表示的含义独立于具体的环境状态;

(2) 明确(explicit) : 概念及它们之间联系都被精确定义;

(3) 形式化(f ormal) : 精确的数学描述, 计算机可读;

(4) 共享(share) : 本体中反映的知识是其使用者共同认可的, 是相关领域中公认的概念集, 它所针对的是团体而不是个体。

然后给出了自己的定义:

尽管定义有很多不同的方式, 但是从内涵上来看, 不同研究者对于本体的认识是统一的, 都把本体当作是领域(可以是特定领域的, 也可以是更广的范围) 内部不同主体(人、机器、软件系统等) 之间进行交流(对话、互操作、共享等) 的一种语义基础, 即由本体提供一种明确定义的共识。这种共识的目标主要是为机器服务。

2 可控词表、分类法、叙词表、元数据、元模型、本体等之间的差别

首先探讨了它们的共同特点。然后介绍了它们之间主要的区别。

2.1   控制词表(Control Vocabulary)

指预先设定的用来描述特殊信息资源的可接受的词的列表。

2.2 分类法( Taxonomy)

是广泛规定的分级的科学。信息科学采用该概念将信息有序化、系统化的分级进行相似特征群组的类聚。

2.3 叙词表( Thesaurus)

叙词表又称为主题词表, 它是一种语义词典, 由术语及术语之间的各种关系组成, 能反映某学科领域的语义相关概念。

2.4元数据

2.5元模型

2.6 本体

本体的目标是促进机器之间或机器与人之间的交流, 而可控词表、分类法、叙词表主要是规范人与人之间的知识交流。

3  本体论相关理论

3.1 本体的描述语言

介绍了一些本体的描述语言。

3.2   本体描述方法或建模元语

Perez 等用分类法组织分析已有本体, 归纳出5 个基本的建模元语(Modeling Primitives), 即一个完整的本体应该具有5 个部分: (classes) 或概念(concepts) 、关系(relations) 函数(functions)、、 公理(axioms)、实例(instances)

3.3 本体分类

Guarino 以详细程度和领域依赖度两个维度作为对本体划分的基础, 详细程度高的称作参考(reference) 本体, 详细程度低的称为共享(share) 本体。依照领域依赖程度, 可以细分为顶级、领域、任务和应用本体等4 : 顶级本体、领域本体、任务本体、应用本体。

另外, 根据主题可分为知识表示本体、通用本体、领域本体、术语本体和任务本体; 根据形式化程度分为完全非形式化、结构非形式化、半形式化、形式化的本体。

3.4  构建本体方法论

Gruber 1995 年提出的5 条构建规则: 明确性和客观性、完全性、一致性、最大单调可扩展性、最小承诺。

3.5 本体的评估

当前对构造本体的方法及方法的性能评估还没有一个统一的标准, 因此, 还是一个需要进一步研究的方向。

3.6 本体的用途

构建一个本体可以解决以下问题: 在用户间或软件代理间达成对于信息组织结构的共同理解和认识、可以复用专业领域知识、使专业领域内的假设变得更加明确、从操作性知识中分离出领域知识、分析专业领域的知识。

4  本体相关描述语言

2004 2 10 , W3C 发布了支持语义网的两个技术标准: 资源描述语言( 修订版) ( Resource Description Framework , RD F) Web 本体语言(Web Ontology Language , OWL)

4.1 XML

简介,优点,缺点。

4.2 RDF RDF. Schema 概述

RDF 定义了一种用以描述资源及其相互关系的简单模型,RDF 通过属性和值描述了资源以及资源之间的关系, 但并没有提供描述这些属性及属性间关系的机制。RDF. Schema 提供了这种表达机制。

4.3 XML RDF 的结合及其不足〔

XML RDF 在处理语义上存在的问题是:

同一概念可有多个词汇表示;

同一个词汇有多种概念(含义)

4.4   OWL 概述

OWL 目前是本体的标准描述语言。

OWL 分三个子语言:OWL Lite OWL DL OWL Full

然后就:相应功能简介、用户在选择使用哪种语言时的主要考虑、这三种子语言与RDF 的关系等问题进行了论述。

 

5  本体论的研究和应用

研究热点具体体现了三个方面: 理论深化研究; 信息系统中的应用,主要包括处理信息组织、信息检索和异构信息系统互操作问题; 本体作为一种能在知识层提供知识共享和复用的工具在语义网中的应用。

5.1 本体论理论研究

5.1.1 本体概念研究

5.1.2 本体构建研究

5.1.3  本体映射研究

5.1.4 本体进化研究

5.2 本体在信息系统中的应用

5.3 本体和语义网

首先介绍了语义web的一些基本概念。然后提出,本体主要有如下几个方面的应用:  电子商务网站、搜索引擎、Web 服务。

5.4 本体论在数字图书馆中的应用发展

5.4.1 应用案例

5.4.2 图书馆面临的挑战

5.4.3 应付挑战的策略

本体要想得到广泛运用,就需要一个描述本体以便进行信息交换的标准语言,即本体描述语言。RDFSOILDAML+OILOWL都是本体描述语言,其中OWL是语义Web发展过程中的一个重要的里程碑,它已经经过广泛的讨论并得到比较一致的认可。

本体描述语言的发展

 

                          图   本体语言的发展

DAML-ONT[1]是由美国DAML(DARPA Agent Markup Language)委员会支持下开发的本体描述语言,它与RDFS紧密耦合,缺乏充分的语义规范;与此同时,欧洲信息技术委员会资助项目On-To-Knowledge研究设计了另一个用于万维网的本体描述语言OIL[2](Ontology Inference Layer)DAML+OIL是上述两个组织协商的产物,它在DAML-ONT的基础之上,结合OIL的语言组件发展而成。W3C总结了上述几种语言的开发经验,于20042月正式推出OWL[3] (Web Ontology Language)OWL是语义网发展过程的里程碑,它经过了广泛的讨论,并得到了比较一致的认可。

 




[1] DAML-ONT Initial Release. 官方网站:  http://www.daml.org/2000/10/daml-ont.html

[2] An Informal Description of Standard OIL and Instance OIL.  http://www.ontoknowledge.org/oil/downl/oil-whitepaper.rdf

[3] Deborah L.McGuinness, Frank van Harmelen. OWL Web Ontology Language Overview, W3C Recommendation 10 February 2004, online: http://www.w3.org/TR/owl-features/, 2006-4-14.

 

ontology研究综述 

邓志鸿  唐世渭   北京大学计算机系

0  引言

1 ontology

1.1  ontology定义

概括介绍了ontology的定义。首先从哲学,人工智能上予以了介绍,然后介绍了Gruber,Borst,Studer等人给出的定义。重点介绍了,Studer给出的定义,包括四层:概念模型,明确,形式化,共享。

1.2 ontology的建模原语

提出Perze提出的5个基本的建模原语。类,关系,函数,公理,实例。

给出了上述5个建模原语的基本定义,然后介绍了关系的类型:partofkindofinstanceofattributeof。并对上述四种类型进行了基本的解释。

1.3 ontology与语义网络

主要介绍了他们二者之间的区别。

1.4 ontology描述语言

ontology的表示方式:非形式化,半非形式化,半形式化,形式化语言。

描述:ontolinguacyclloom等。

并对描述的三种方式进行了简单的介绍。

1.5 已有的ontology及其分类

介绍了广泛使用的5个:wordnetframenetgumsensusmikrokmos

介绍了guarino关于ontology的分类:顶级(toplevel),领域(domain)、任务(task)、应用(application)。并对每个分类进行了详尽的解析。

随后简单介绍了perezbenjamins的细分,分为10类。

1.6  构造ontology的规则

介绍了gruber提出的5条规则:

明确性和客观性,完全性,一致性,最大单调可扩展性,最小承诺。

2 ontology的研究与应用

三类:理论上的研究、在信息系统中的应用、在语义web中的应用。

2.1 ontology的理论研究

概念及概念的分类,ontology上的代数,有代表性的是guarino等人对概念及其分类进行的研究工作。

概念分类理论的基础是概念的元特性。

基本的元特性包括:持久特性,非持久特性,反持久特性,半持久特性,载体表识特性,支持标识特性及外部依赖特性。

2.2 ontology在信息系统中的应用

首先介绍了信息检索的方式:全文检索,数据检索,知识检索。

然后提出了基于ontology的信息检索的基本设计思想。

介绍了信息检索的著名项目:(ontoagentontobrokerskc

2.3 ontology与语义web

首先介绍了语义web的层次。

然后介绍了xml的一些基本概念,提出了元数据的概念,并对rdf进行了介绍。

针对xmlrdf都不能解决的同义词,多义词问题,引出了ontology的应用。

ontology描述语言:ontolingualoom

xml描述语言:shoeomlxolriboweb,rdfsoil

ontology的著名项目:oilshoedaml

3.结束语

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2006年07月31日

http://adlab.microsoft.com/dpui/DPUI.aspx  ,这个网址提高这项功能。

http://blog.donews.com/dont的分析如下:

 

Gender: Male-oriented, with the following confidence:

male:0.79

female:0.21

  Age: 18~24 Oriented with following distribution:

2006年07月29日

Google 排名有利因素(一)

关键词:
1.url中的关键词(第一和第二个字是最有价值的……)
2.域名中的关键词(英文网站的优势)

(Head部分)
3.Title tag中的关键词(10-50个字符,不包含特殊字符)
4.Description tag中的关键词(小于200个字符,这个参数现在Google已不再把它作为
重要参数,但仍经常使用)
5.Keywords tag中的关键词(小于10个字,单个关键词必须在页面Body部分出现2次以上
才有效,否则可能会被评估为Spam而受到处罚,Google官方曾说明说不再依据此参数评
价,但其实仍在使用)

(Body部分)
6.关键词在Body文字部分的密度(5 – 20% – (all keywords/ total words))
7.单个关键词密度(1 – 6% – (each keyword/ total words))
8.在H1、H2、H3中的关键词(使用H1、H2、H3字体)
9.关键词字体尺寸(使用黑体、粗体、斜体……)
10.关键词接近度(2个关键词之间邻近的是最佳)
11.关键词短语顺序

(其他部分)
12.关键词在Alt文字中(图形中的Alt属性)
13.关键词在外部站点链接中(锚文本)

导航-内部链接部分:
14.内部页面的关键词(链接页面应该包含关键词)
15.所有内部链接必须是有效的
16.结构树(任何页面不超过4层深度链接)
17.低级页面之间适当的链接

导航-外部链接部分:

18.外部页面的关键词(Google的专利 链接须指向优秀站点,不要链接frame)
19.外部链接的锚文本(Google的专利 应该在此上展开主题和叙述)
20.链接稳定性(Google的专利 避免链接随时变换)
21.所有外部链接是有效的
22.少于100个外部链接(Google官方称限制100个,实际容许2-3次2000个)

Google排名有利因素(二)

页面上的其他因素:
24.域名等级(.edu是最高等级,其次是.org,而.com由于包含很多spam信息,所以会受
到Google的严格审查)
25.文件尺寸(页面尺寸绝对不要超过100K,小于40K的为最佳)
26.URL中的连字符(1个或2个是最佳的,4个以上将被认为是spam,10个很可能被降级)
27.页面更新率(Google专利 对于新闻、零售、拍卖等站点更新越快越好)
28.页面数量的更新率(Google专利 老页面与新页面的比值)
29.链接的的更新率(Google专利 尚未能分析)
30.更新频率(更新频率=蜘蛛的抓取频率)
31.页面主题
32.关键词衍生…..
33.语义关联(同义词等…)
34.潜在的语义索引
35.URL长度(尽可能的小,在IE中只允许2000个字符以内,最好控制在100字符以内)
36.站点大小(Google认为站点越大说明更大的资金支持、更好的组织、更好的架构,因
此它会是好的站点)
37.站点年龄(Google专利 越老越好)
38.页面的年龄与站点上其他页面的年龄

Google排名不利因素(三)
39.在图像的form中有文字描述,但Body中没真正的文字描述;
40.镜像站点
41.过度优化
42.链接一个坏站点(不要链接frame….,定期检查每个外部链接站点在Google的状
态)
43.重定向或刷新metatags(除非用户点击,否则不要自动跳转页面)
44.不要使用一些不文明的词汇
45.毒药单词
46.过多的横向链接(在你的WEB服务器中有多个站点,它们的横向链接会被视为无效的
投票)
47.图片、文字的反盗链
48.关键词重复填充(降级处理)
49.关键词稀释(页面存在过多的非相关关键词,将会降低你真实内容的重要性)
50.页面内容编辑会降低一致性(Google专利 Google定期会对老的cache与新的cache进
行比对,如果发现关键词、主题变化了,将会影响它的评价,这是Google针对SEO的有效
工具)
51.内容改变频率(Google专利 过于频繁是不利的)
52.锚文本更新率(Google专利 过于频繁是不利的)
53.动态页面(这是搜索引擎的缺陷,可采用缩短URL,减少变量等办法,最好不要使用动
态页面)
54.过多的JS代码(不要使用重定向和隐藏链接功能)
55.Flash页面(搜索引擎的蜘蛛是不能抓取flash内容的,如果要用flash页面,须同时
有一个静态入口页面)
56.使用frame
57.Robot中设置了“no index”的tag
58.单个像素的链接(会被认为是一个鬼祟的链接)
59.不可见的文字(文字与背景色相同,页面上不可见,但能被蜘蛛检索到)
60.门页(Google专利 )
61.内容重复(Google通常选一个最老的推送到前面,把其他的推送下去)
62.HTML代码需符合W3C标准

Google排名有利因素(非页面) (四)

反向链接:
63.PR(基于指向站点的链接数量和质量)
64.总的反向链接数(link:www.xxx.com Google |  linkdomain:www.xxx.com
Yahoo….)
65.反向链接页面PR>4
66.链接流行度(Google专利 推进太快会被认为是作弊)

每个反向链接:
67.每个涉及页面的PR
68.链接到你站点的锚文本(Google炸弹)
69.链接时间(Google专利 越久越好)
70.锚文本改变频率(Google专利 频率越高越不好)
71.涉及页面的流行度
72.涉及页面的外部链接数(越少越好,证明你的重要性)
73.涉及页面链接的位置(在HTML代码中最好)
74.涉及页面的关键词密度(针对搜索关键词)
75.涉及页面的title
76.链接来自"行家"网站(Google专利 极大的推进)
77.涉及页面主题相同

目录:
78.被DMOZ收录(巨大推进,因为Google的目录是从DMOZ获取的,一般要28个月才可能被
收录)
79.DMOZ分类(据说综合类和地理类主题最适合收录)
80在Yahoo目录中收录(巨大推进,但需要每年支付299美金)
81.在LookSmart中收录
82.被inktomi收录
83.被其他目录类网站收录
84.特大站点的引入链接
85.站点历史悠久表明越稳定(对新的内容至少可以产生1-3周的推动)
86.站点目录树
87.站点地图(关键词在锚文本中体现)

用户行为:
88.页面流量(Google专利 visters数量及趋势)
89.页面选择率(Google专利 经常被点击的页面数量)
90.在页面上花费的时间(Google专利 相对长的时间表示对内容的认可)
91.用户是否将此页面加入书签(Google专利 )
92.用户删除此书签(Google专利 )
93.用户离开后去了哪儿(返回?点击链接?….)
94.用户使用的关键词
95.在此域名上花费的时间

网站主行为:
96.域名注册时间 (5年以上是一个有价值的)
97.是否加入合法联盟(拒绝spam,版权保护等)

Google排名不利因素(非页面)(五)

98.流量购买(这些流量产生低的转化率,甚至是0转化率,被认为是来自坏的外部链
接)
99.链接分析(老的链接有价值,新的链接暂时没价值,用来阻止快速更改)
100.零外部链接
101.购买链接(Google专利)
102.站点排名优先(Google专利)
103.隐藏(给Google蜘蛛读取的是一个特定的页面,真正显示的是另外的页面)
104.来自坏站点的链接
105.域名偷窃(非法行为,将会被剔除)
106.如果同一IP向Google发送100次同一请求,可能将会被BAN这个IP
107.服务器可靠性>99.9%(注意你的Google更新时间,尽量不在此时间维护)
108.页面被剔除来自大的站点
109.排名处理由于竞争对手的侵害

http://www.chengtao.name/modules/dokuwiki/doku.php?

前言:
Zac 提起Google在他的搜索排名算法里面正在加入更多的用户行为方式,我完全同意该观点。
认识与研究Google很久了,对Google的搜索行为有一个基本认识: Google的排名算法不会局限于任何一种因素,不会忽略任何一种因素,尤其重视自然因素。
很多人会笑话这样的认识,认为是空谈,然后,我作为一名开发人员,完全认为采用如此的策略是明智的。

引入更多用户行为方式的基石在于Google ToolBar, 这是Google最近花大金钱捆绑在Dell机器上的玩意儿。 它能做什么? 能统计用户的查看网页的行为。

什么是桥页? 桥页如何作弊?
桥页就是在第三方网站上做一个页,堆砌了大量的关键词,让该页在搜索引擎收录里排在前边,如第一页,然后,在桥页中注入转向代码,用户来到该页,实际上却去了另外一页。
这里,第三方网站一般是一些BLOG,这些BLOG允许一些转向HTML代码及Javascript代码,包括blog.donews.com。

搜索引擎的无奈:
百度主要依靠人工防作弊。但在上边的作弊方法中,百度不敢封第三方网站,如blog.donews.com,因为它是无辜的。
百度也不敢封目标网站,因为它也可能是无辜的。 (有人恶意栽赃,不是它要的)

这种作弊在百度里非常泛滥,但在Google中却几乎绝种。
http://www.baidu.com/s?ie=gb2312&bs=%CF%E0%C9%F9%D4%DA%CF%DF%B2%A5%B7%C5&sr=&z=&cl=3&f=8&wd=%C1%F5%B5%C2%BB%AA%CF%E0%C6%AC&ct=0
排名第一的: http://qoito.blogbus.com/files/1142761371.htm
被导向到: http://mms.zzling.com/?

这意味着,异常热门的关键字,很多都被桥页占满了。换句话,百度在被强奸。

Google是如何对付的呢?
能够想象的有两种方法:
方法一: 分析网页中的转向代码,遇见可疑的转向代码,降低权重。
方法二: 利用分析用户的行为,对于停留不超过N毫秒的页,降低权重。

方法一的可行性是有的,但不能完全解决问题。原因在于Google现在并不分析嵌入的JS,对JS本身也不重视。作弊高手可以写复杂的转向代码来欺骗Google。

我所能相信的有效方法应该是方法二:
分析用户的行为,对于停留不超过N毫秒的页,做spam标识。

能想象到的更完善的算法可以是:
如果A页是来自于搜索引擎,下边的算法启动:
如果A页被A用户浏览且不超过N毫秒,然后马上导向到B页。则标识 A–>B为 桥页spam。
如果被标识次数大于N,N可以是3,且来自于不同的IP,就可以降低A页的权重了,但不应该去动B页。

这里,降低而不是封杀是安全且可靠的,基于以下考虑:
1) 竞争对手恶意利用,来封杀对手。
2) A页有人浏览,但每次被用户马上忽略,则应该为不重要的垃圾页。
3) B页不能封杀是因为B页可能是无辜的。

前边说过,这方法的基石在于,Google Toolbar,用它来统计用户的自然行为。
百度同样有Baidu Toolbar,由于上边的算法并不需要基于海量的数据统计即可有效,因此,即使基于baidu toolbar当前的安装量,也是可以进行的。

作者:罗亭
发表于: http://blog.donews.com/principle
转载且注明原来路。