06月 27, 2012

经常看到网站举办活动,他们会要求参加者会在他们的网站上面加入活动方的网址,那么这么一来,参加活动的网站的越多,那么活动方的网站就可以迅速的积累大量的反向链接。但是要声明的是,这样的吸引链接的方法,已经违反了google的链接规范哦!

这篇”Link Incentives Are Against Google’s Webmaster Guidelines”地址是:http://www.seroundtable.com/google-link-incentives-15336.html ;也提到有人问說: 如果网站以链接当成服务交换的目的,是否违反google的链接的规范呢?

结果Google的John Mueller回答说:

I’d strongly recommend not making PageRank-passing links to your site a requirement for any kind of interaction on your website. Links placed like that are generally not natural links, not the kind of links that our algorithms want to find. Past that, not all businesses or people have real websites, it seems like it would be a bit unfair to block them from being able to use your site to its fullest (and in turn, if they end up loving it, recommending it to their friends & business partners). By all means, make it easy for users to recommend and to link to your site, but don’t use that as a requirement.

译文如下:

我强烈的建议不要用可以传递Pagerank的链接來交换网站上的互动。那样的链接不是我們想要的自然链接,如果你们以链接要求來让人们取得更多服务,这个是不公平的,因为并不是每个人都会有网站。总之,让使用者可以很方便的去推荐你的网站,但是不要当成一個必须的条件。

也就是说,网站不能要求使用者必须先建立链接到你的网站链接,当成换取服务的条件。

但是问题是,Google如何判断这些情況呢? 如何判断這些链接是网站设下的条件,还是使用者出于自愿,自己给的链接呢?

如果你有任何看法,欢迎参与讨论!

 

06月 25, 2012

从22号开始,很多网站(包括我自己的)在一夜之间排名尽失,至于什么原因,我不是百度因此我不好去分析,但是我相信这个问题应该会很快得到解决的,在此期间,大家该做什么,还是做什么,不要病急乱投医。

针对近段时间比较热火的百度点击器的事情,本人昨天也做了一次简单的测试。本人测试的网站自然是自己的博客了,我的这个博客一向是自己的SEO测试站,不管有什么样的想法,都会用它来先做测试,效果好再用到自己的网站上面。下面我介绍一下我的这次测试的过程和结果。

首先确定关键词和被点击的网站

刚刚我也说了,是拿自己的博客做的测试,因此最重要的就是关键词的选取!

首先,确定自己的SEO博客排名前三页的,流量比较大的关键词。这个可以用chinaz 的百度权重工具查找。

因此我选择了“湖南SEO”、“博客优化”、“长沙SEO顾问”三个词来做测试!

经过昨天不到12小时的测试,效果是惊人的,分享大家看一下结果;

关键词“博客优化”的结果

关键词“湖南SEO”优化结果

关键词“长沙SEO顾问”优化结果

截止到发帖至今,排名依然坚挺,但是我已经早就停止了点击,什么时候会掉,待观察!

虽然效果是惊人的,但是我依旧奉劝各位不要轻易的去尝试,百度我相信已经开始打击点击作弊了,虽然不敢肯定我的网站被K是不是和百度打击点击受到波折有关,反正已经是这样了,还是老老实实的优化你自己的网站吧!

06月 19, 2012

我们来谈谈,网站该不该销售链接,无论是百度或是google,只要发现网站有销售链接的行为,就会进行处罚,对吗?

是的,无论是百度,或是Google都不不喜欢付费链接的,所以大家都认为搜索引擎基本上不允许网站销售链接,只要发现网站有销售链接的行为,就会进行惩罚,其实这只是部分的事实,我们仔细来探讨看看。

搜索引擎为什麽不喜欢网站销售链接? 不喜欢网站以付费链接方式去增加链接呢?

这是因为搜索引擎不喜欢网站以人为的方式去影响搜索引擎排名的结果,但是目的不在于链接是否付费,就算是免费的交换链接,也同样以人为的方式去影响搜索引擎的结果,也是搜索引擎不喜欢的。搜索引擎喜欢的是自然增长的链接,也就是网站增加了这个链接是有必要的链接,并且不是大量的增加链接。

什麽叫做有必要的链接呢? 最主要就是要与本文谈到的内容是相关的,并且在数量上与锚文本链接上不要明显锁定在某个关键词,关键词多样化一些。

什麽是相关链接? 当然就是如果我们现在写的是“搜索引擎优化”,而链接到“搜索引擎优化”的网站也是同样内容的网站,也可以是IT类的,这也是我们常说的链接的相关性。

什麽是在数量上与锚文本上不要明显锁定在某个关键词? 就是不要一个页面有过多的链接指向相同的页面,并且都使用少数几个相同的锚文本。但是,「过多的」与「少数几个」的定义并没有一个明显的界线,而是看比例上。

所以自然的链接就必须符合上述的原则,那麽除了自然的链接之外,我的网站可否销售链接呢? 答案是可以的,但是要按照搜索引擎的原则,就是不能影响搜索引擎的结果。

要链接不影响搜索引擎的结果,就是要不能传递PageRank,不能传递页面的权重,所以就是要给这样的链接加上NoFollow标签,然后要把付费链接跟自然链接可以很明显的让网站的访问者能够很明显的区分,让他们知道付费链接是广告链接。

只要在链接加上NoFollow,并且让访问者可以清楚的知道这是付费链接,无论是百度或者google是不反对销售链接的。
真的是这样吗? 我们来看看Google的Matt Cutts怎麽说的:

Matt Cutts很明确的说,只要加上NoFollow,并且让访问者可以知道是付费链接,你的网站是可以销售链接的,那是你的网站的自由。(不过这个自由似乎少了一点就是了)

百度也在“买卖链接的危害”一文中提到:

对于广告类的链接,请您使用nofollow属性进行设置。

所以搜索引擎之所以会进行处罚一些违反规定的网站,不是因为他们销售链接,而是因为他们「销售会影响搜索结果的链接」。

但是你可能会问,加上NoFollow之后,还会有人会购买不能影响搜索结果的这种链接吗?或者说,加上NoFollow之后,这个链接是否就是废物了呢? 这是我们以后要再探讨的问题,也欢迎您提供想法哦。

06月 17, 2012

知名站点,是指已经有较高用户知名度的网站。站点越是知名,就越应从长远考虑,以用户体验为重,积极、合理的进行网站优化,远离作弊和恶意SEO行为。

我们经常可以看到一些知名站点使用了不够合理的内容建设方式,比如:

  1. 大量不同内容的页面均使用同一标题。
  2. 通过图片的方式展现网页中的重要信息(新闻、联系电话等)。
  3. 重要页面通过flash建设,未使用文字说明;

    类似的方式,都会使搜索引擎对网站内容的理解造成困难,最终影响网站在搜索引擎中的表现。我们建议您采取对搜索引擎友好的方式进行网站建设,具体内容可参考《百度搜索引擎优化指南》。

知名站点应远离作弊行为

    知名站点对搜索引擎,乃至整个互联网欢迎的影响通常是巨大的,若使用恶意的作弊行为,其产生的影响也就越坏。例如:

1、出售首页的友情链接。

2、大量采集其他网站的内容,原创内容比例极低,甚至大量采集网站主题无关的内容,或机器批量生成没有价值的页面。

3、网站被大量广告内容占领。

    这些知名的站点,一旦有恶意的作弊行为,所产生的恶劣影响将是巨大的,有可能会受到搜索引擎更为严格的惩罚。知名站点更应从长远考虑,提升用户口碑,用高质量的内容赢得用户青睐。不应为了短期的流量,不顾用户的体验,做有损品牌形象的事情。

    此外,知名站点也是各路作弊者的“众矢之的”,容易被恶意利用。站点越知名,被利用的价值就越大。我们建议您建立防范意识,避免由于被作弊者利用引起的不必要风险。

您的站点是否足够安全?当网站被黑客攻击时,是否有足够的应对机制?

由用户贡献内容的功能,是否做好了应对作弊的措施?

对于不想让搜索引擎收录的内容,是否在robot.txt中清晰指明?

利用引导产品做优化

    百度的“搜索框提示”和“相关搜索”,可以显示近期用户的热门搜索关键词。您可以依据搜索提示中的关键字,了解用户常使用的关键字,作为网站优化的参考。

    但如果通过不正当的手法,蓄意影响百度的“搜索框提示”和“相关搜索”,则是一种非常恶劣的作弊行为。对于这类恶意行为,百度将从严处理。

    蓄意影响百度的“搜索框提示”和“相关搜索”,会严重干扰正常用户,会引起用户的反感。由于系统防范策略的作用,网站的正常名称可能会被“搜索框提示”和“相关搜索”清除,特别恶劣者,可能会影响网站在百度搜索的表现。

06月 15, 2012

以前看到过一篇《SEO七言绝句》,今天在群里面看到了一首很有意思的SEO三字经,不知道是谁写的啊,蛮有意思的,或许很多人已经子自己的博客里面分享过了,但是个人觉得好东西还是要多推广一下的,分享给大家看一下!

        做优化,心态正,不浮躁,执行力,必须强;

  站之初,先想好,怎盈利,再定位,后主题;

  依主题,来筛选,关键词,长尾词,选内容;

  关键词,要确定,需分析,看指数,不幻想;

  目标词,为何物,搜索时,所用词,现主页;

  长尾词,除目标,给网站,带流量,即长尾;

  目标词,不宜多,集权重,切主题,有价值;

  长尾词,指数少,数量多,竞争小,易优化;

  定好位,选好题,关键词,长尾词,确定好;

  做优化,先站内,后站外,内容王,外链皇;

  目标词,现首页,三要素,次导航,锚文本;

  站首页,应美观,结构明,用户来,不讨厌;

  三要素,标题处,关键词,描述里,不堆积;

  次导航,即页脚,目标词,该处放,效果佳;

  锚文本,功劳大,巧利用,关键词,排名来;

  做内链,发外链,锚文本,文本字,切主题;

  网站内,文章中,关键词,可加黑,或加粗;

  长尾词,要优化,在内页,分类栏,文标题;

  站优化,长尾词,如做好,流量超,目标词;

  网站外,发外链,唯一性,多样性,重质量;

  纯原创,添外链,规律做,坚持做,勤观察;

 

06月 12, 2012
1、百度是否能抓取CSS样式表并识别分析?
百度是能够抓取并分析CSS的。

2、去年百度5.20大更新,你有什么看法?

简而言之:我们的系统在更新数据的过程中出了点状况,问题被及时发现后,已经于5月20日中午修复,目前还有部分内容由于缓存等原因正在更新中,很快就会恢复正常。今后我们会加强相应的保障机制,避免再次出现同类问题。同时也很抱歉让大家造成一些误解。

3、百度蜘蛛爬行不存在的路径?

Baiduspider 只抓取能从互联网上找到的url,如果Baiduspider大量抓取你网站上不存在的url,可能有两个原因:

1)你网站内有部分网页指向其他网页的url格式不正确。

2)互联网上有其他网站指向了你网站内不存在的网页。另外,Baiduspider抓取到不存在的网页,服务器应该返回404错误。

4、我在robots.txt中设置了禁止百度收录我网站的内容,为何还出现在百度搜索结果中?

如果其他网站链接了您robots.txt文件中设置的禁止收录的网页,那么这些网页仍然可能会出现在百度的搜索结果中,但您的网页上的内容不会被抓取、建入索引和显示,百度搜索结果中展示的仅是其他网站对您相关网页的描述。

5、新域名在百度下的权重比旧域名高的情况下,将旧域名301重定向到了新域名会有什么影响?或者说百度下的301是将权重替换还是叠加的呢?

将旧域名301重定向到新域名,旧域名的权值会叠加到新域名上。但是百度对301重定向反应比较的慢,也有人说没有用。所以真正的效果还得自己去实验。

6、网站的gzip压缩对网站的收录和权重有没有影响?

gzip对收录和权重没有影响。对搜索引擎唯一的影响,是抓取速度会快一些。

7、域名A曾经301至域名B ,如果现在又将域名B301回A是否还能保持原来权重?

会,但会有一段时间的考查和权值转移期。

8、百度的真正外链是什么命令,是否无法查询?

百度目前没有查询外链的查询命令,所谓的domain,查询的是网站的相关域,和外链没有关系!不过可以作为参考!

ZAC前两天在博客里面介绍了bing推出了外链查询工具,大家可以去试一下!

9、标题长短对于网站权重的影响有多大?

正如同一个页面上的导出链接越多,每个链接获得的权重越小一样,title上的关键词越多,单个关键词获得的权重也会越低。这是很直观的逻辑。但是,如果为追求某个关键词的权重,极力压缩标题长度,那么真正合乎该页面的搜索需求,又很难被命中。所以,一般性的建议就是,实事求是的将页面主旨反映在 标题中即可。如果要做长青树,不要在乎一时一刻的seo效果(那个很累、很烦),把网站的忠实用户人气做起来就成了。

10、修改页面标题(如增加前缀或后缀)是否会影响网站排名?

title是极重要的内容,大幅修改,只会带来大幅波动,所以请慎重对待网页标题。(尽量不要改动网站标题)

11、修改首页的description标签,会不会受到惩罚?

这个肯定是多虑了,搜索引起一般都鼓励大家通过description来撰写网站的简介,只是过于频繁的修改,可能不会及时反馈在摘要中。

12、更换服务器是否对排名有影响?

原则上是不会的。除非新换的服务器太糟糕,三天两头访问失败,或者服务器从国内换到国外,这就很可能被和谐。

13、百度对重复内容是如何处理的?

搜索引擎的排序出发点,是用户的搜索体验。虽说,很多时候尊重原创和用户体验是一致的,但是,毕竟也有一些案例,转载的体验会比原创更好,这时原创的排序未必会高于转载者,但是,原创的应该以另外一种方式被肯定,而不是简单的被聚合掉。

14、我买了一个老域名,重新建站,权重会继承吗?

正常的域名转手,域名会被当做一个全新的域名看待,前帐一笔勾销。

15、百度对如何看待nofollow?

如果您不想搜索引擎追踪此网页上的链接,且不传递链接的权重,请将此元标记放入网页的 HEAD 部分:meta name=”robots”  content=”nofollow”;如果您不想百度追踪某一条特定链接,百度还支持更精确的控制,请将此标记直接写在 某条链接上: a  href=”signin.php” rel=”nofollow”>登录 /a

16、修改robots之后多久生效?

不同的站点略有不同,但通常会在几天内生效。根据笔者的经验,只要保持外链的增长和原创内容的更新,大概是4天对于老站,而新站大概一个星期左右。

17、一个页面有多个重复的链接,并且链接文字相同,搜索引擎在传递权重时,只传递一次权重,还是每个链接都要传递权重?另外,这几个重复的链接获得的权重一样么?

重复的链接不会增加链接权重

18、百度是否能识别和处理纯文本形式的链接(非标签)?

可以,搜索引擎的spider需要及时发现和抓取互联网上的链接,至于链接是什么形式,并不重要,也许有一天,我们还可以识别图片里、语音里、视频里或是其它形式的链接。

19、option标签里面的链接可以被蜘蛛抓到么?

可以提取,效果等同于A标签。

20、标题过长是否会对百度搜索不利?

这个自然是没有限制的。很多人喜欢往标题里塞很多关键词,以为那样就全面开花,但很可能适得其反,这个原理跟在一个页面上有多个超链接一样。分一杯羹的人越多,每个人所得的羹越少。

21、百度什么时候更新?

没有“更新前”和“更新后”,百度无时无刻不在更新。

22、假如竞争对手恶意群发我网站链接到非法站点,对我网站有影响吗?

我们有很完善的识别算法,这些行为并不会导致你的网站受到影响。

23、很多人说.info和.hk等域名被降权了,是不是真的?

使用何种后缀的域名,对搜索引擎没有直接的影响。但.com、.cn、.net等常见的域名后缀更容易记忆,增加用户的判断成本。

24、百度建议URL静态化吗?还是像Google一样,不建议URL静态化?对伪静态怎样看待?和真的静态文件一样吗?

对URL的动静态,没有歧视政策。之所以以前有过提倡静态的说法,是因为很多动态URL,带了很多参数,而实质上内容是一样的。这个给spider以及站长都带来不必要的麻烦。我们 在这上边花了不少精力。所以,总的原则就是,URL的动静态无所谓,只是尽可能的避免重复即可。但是动态url也不要动态得太变态,搞几十个参数,那会吓 着蜘蛛。酝酿中的sem指南,会有对url优化方面的详细说明。

25、搜索结果中显示标题与实际标题不一致?

原因比较复 杂,需要针对性分析。主要原因可能是tag  title提取失败,系统只好从其他地方取了一些文本作为标题。这种提取失败的原因,有网页设计层面的(比 如全是flash或者ajax),也有 robots封禁层面的(某些重要网页虽然不抓取,但会保留url本身)。还有一些系统异常也会造成类似的现象。如果不符合一般性的预期,这类问题都可以 直接提交至webmaster@baidu.com。会有工程师跟进的。

26、在百度快照里页面没有显现完整,首页底部(友情链接及版权信息那块)代码和页面都没在快照中出现,那么友情链接对其他网站还有用吗?

这种情况不会影响友情链接。另外,我们建议尽量将页面大小控制在合适范围内。

27、以前百度显示网页体积的时候最大是125K,超过这个范围快照显示就不正常,是不是意味着网页体积大于125K就对搜索引擎的抓取或收录有影响了?

页面大小和搜索引擎的抓取之间没有直接关系。但我们建议网页(包括代码在内)不要过大,过大的网页会有抓取截断;而内容部分,也不要过大,过大会被索引截断。当然,抓取截断的上限,会远大于索引截断的上限。

28、Google倾向于说每个网页的导出链接不要超过100为宜,百度有没有什么建议?

这个暂时没什么建议。一般情况下,链接数量,会影响到这些链接从该页面上所获得的权重;少就多分一些,多就少分一些。

29、js代码弹窗是否会影响自然排名?

任何对用户体验有增益或者减益的做法,其实会影响到用户的”投票”行为。而这些投票行为,又会影响搜索引擎对这个网站的评价算法。所以,弹不弹窗并不重要呀,关键是这种弹窗会对用户造成什么样的影响。

30、百度针对连接上存在不存在有效期的问题,意思上是说,一个链接的权重会不会过一段时间后就会没有了,或者逐渐降低?

如 果各位站长要揣摩百度的策略细节,我觉得不如站在用户的角度,用一种合乎常理的逻辑去做推断。比方链接时效性问题,实际是有利有弊。利在于,过去 的投票,只反映被投票者在过去的价值,不见得能反映现时情况;弊在于,正常投票不大会重复投,过去投过了,现在就可能不投了,但不代表现在对被投票者的不 认可。那么究竟应该怎么做呢?呵呵。我也不清楚。

31、原创内容不能被识别怎么办?

这个,只能说百度的策略还不是很完善, 我们也一直在改进。另外,从用户体验角度,有些转载未必比原创差。比方一篇科技原创博文,被知名门户网站的科 技频道转载。如果这种转载保留原创者姓名和出处链接,实际上对原创者是有利的,因为起到了更好的传播效果。只是国内的转载,很多是掐头去尾,使原创者比较 受伤。

32、百度是否跟踪JavaScript链接?

javascript的解析,是很多搜索引擎正在做的事情;同理,对 flash的解析。毕竟有那么多应用javascript或者flash的网 站,其实并没有意识到,他们的做法给搜索引擎的收录和索引带来的麻烦。所以,如果期望不被搜索引擎收录的话,最直接的手段,还是写robots文件。

33、链接点击率是否计入排名算法,百度是否有会估算某网页的某个反向链接被点击次数(例如:从工具条、流量统计等工具得到的部分数据)?比如是否把链接的点击率计入算法之中?是否会利用这点来判断哪些是隐藏链接?或者判断外链的相关性等因素。

我只能说,一切有利于排序改进的因素,都有可能被搜索引擎尝试应用。

34、为什么蜘蛛每天爬n次,而收录网页只有一两篇?

网页抓取和建立索引是不等同的。这些网页会经过一些必要的chk过程之后才会被建入索引。

35、link和domain有什么区别?

link:

    百度,link 并不代表一个指令,只是一个普通的关键字。link:www.xuefeng-blog.com 搜索结果是包含这样一个关键字(link:www.xuefeng-blog.com )词组的所有网页,与其他普通关键词的搜索一样。并不是查找反向链接。
    Google,查找的是反向链接,但只包含网站所有反向链接的少部分。我们推荐使用Google网站管理员工具查网站所有反向链接。
    Yahoo,查找的是反向链接,但需要在域名前加 “http://”,如:link:http://www.xuefeng-blog.com注意:域名加与不加”www”结果是不一样的。

domain:

    百度,查网页内容中包含某关键词。如:domain:www.xuefeng-blog.com,搜索结果是包含关键字词组(www.xuefeng-blog.com)的所有网页。同理,domain:长沙seo 指的是包含seo的所有网页,与直接搜索 SEO 相似。如果要查找有多少个网页内容中包含你的网址,domain可以派上用场。
    Google,domain 并不代表一个指令。只是一个普通的关键字。
    Yahoo,与 site 一样。查找域名下的所有收录网页。

36、robots.txt文件有什么必要?

从SEO的角度,robots.txt文件是一定要设置的,
    网站上经常存在这种情况:不同的链接指向相似的网页内容。这不符合SEO上讲的“网页内容互异性原则”。采用robots.txt文件可以屏蔽掉次要的链接。
    网站改版或URL重写优化时原来不符合搜索引擎友好的链接需要全部屏蔽掉。采用robots.txt文件删除旧的链接符合搜索引擎友好。

37、网页的内页链接过多会不会降低网页的权重?

网页内部链接数量得站在全局看问题。链接数量过多,每个链接得到的权重就越小,但如果A页面给B页面的链接多,C页面给A页面的也就越多(A、B、C不代表单个页面),这样综合起来也就差不多平衡了,犹如大型门户网站,页面链接几百甚至上千,页面多了,也就不寸在什么流失了。另外LEE曾经提过,如果网页体积太大,造成抓取不完全,但链接信息提取是完整的,搜索引擎提取链接的数量超乎我们的想象。

38、现在URL中带关键词作用大不大?

有作用,但很小,是很多因素中的一点,而且目前还没有发现在百度中文URL中带关键词而排名很好的网页。

39、内链的建设问题,在内部链接的建设中,是采用绝对地址还是相对地址?

建议采用绝对地址。

40、网站两个相似页面,用什么标签还可以告诉搜索引擎唯一性?

可以使用rel=”canonical”来规范网页。

41、网站什么样的结构才算比较好啊?

扁平的树形网状结构。

42、是不是一定要做301啊,我以前没有做301,请问下现在是否还要做,做了会对网站有影响吗,如果做了,是不是排名都没有,还要重新开始?

301重定向是进行URL标准化,根据你目前推广最多的URL来决定,比如你外部链接中推广的URL都是带www的,另外如果你站内已经实用了带www的绝对地址,那么就可以将不带www的URL重定向到带www的上面。301后的效果是权重叠加而不是替代,所以及时是暂时出现问题,很快也回恢复。

43、如何把已经收录但是掉了的文章重新收录再回来,前天我晚上收录掉了50,不知道如何让这些之前收录的页面都回来,如果在已同样的名称命名的话,再发表一些文章,影响吗?

搜索引擎都有更新周期,更新的时候收录数量都会有所变化,你目前要解决的问题是找到为什么收录会减少的原因,而不是去增加相同URL博得收录。

44、我用工具发现死链有超多的,我点击这些链接发现又可以连接,这是为什么?

工具查询是基于网络进行的,网络不稳定就会出现查询不准备的现象。

45、网站的某些页面做了301或者302跳转,在网页源代码里面,可以看出来吗?

如果是用程序实现的,可能看的见,如果的主机或服务期配置,则看不见。

06月 6, 2012

前些天读了一本《选举的困境》,其中有一章,从美国的选举制度说起,介绍美国选举制度的不足,然后针对其不足,提出种种改善,然而每种改善都有其各自的问题,其中的变化很有趣。

    先说美国选举制度,美国的总统选举是一种“赢者通吃”的方式,每个州根据其人口多少,有几十或几百的“州票”,州里的人对总统候选人进行选举,在某个州获得票最多的那个候选人,获得这个州所有的“州票”,然后统计所有候选人的“州票”多少,获得最多“州票”的候选人获胜。

    这样制度的问题是显然的,比如如果只有两个州,A州5个人,而B州4个人,州票也分别是5和4,如果某候选人X在A州以3:2获胜,另一个候选人Y在B州以4:0获胜,这样显然候选人Y在全国范围内获得了6张票,而候选人X只有在A州的3张票,但是由于“赢者通吃”,X获得了A周的全部5张“州票”,Y只获得了B周的4张“州票”,在全国只有1/3民众支持的X居然获得了选举的胜利。

    这样的情况在2000年美国总统选举中就出现过,小布什的州票领先于戈尔,然而在全国民众中统计支持戈尔的人数却是大于小布什的,当然戈尔输给小布什还有另一个原因,这里按下不表。

 

    如果放在算法领域,可以看出这里的问题在于,为了统计结果R(最适合的总统人选),找到了一个特征A(每个民众的投票),而决定结果R的,却不是特征A,而是由特征A推导出来的特征B(州票),在特征A向特征B的推导过程中,信息丢失了(每个洲的支持百分比不一样)。

    “赢者通吃”这种制度的具体历史原因先不说,有兴趣的朋友可以去看原著。解决这种问题的最直接方案就是从“赢者通吃”变成直选,也就是一人一票,直接统计票数,然而这样也会遇到一系列问题。

    在谈那一系列问题之前,先把要解决的问题抽象一下:

    有n个候选人,每个选民对这n个候选人投票,最终在n个候选人中选出最合适、最符合民意、也符合逻辑的那个人。

方案1:一票制,每人一票,选出自己最喜欢的候选人,对结果进行统计,得票最多的那个人当选。

    这样做的问题是会导致作者定义的一种“鹬蚌困局”,举例说,如果有ABC三个候选人,其中BC政见比较类似,支持B的人也比较支持C,反之亦然,在全民中,喜欢BC的人占多数,A的政见和BC相反,支持A的人在全民中占少数。这样导致的后果就是,BC获得的票会比较分散,而A获得的票比较集中从而获得胜利,如果BC中有1人不参加选举,票就会集中到B或者C一个人的手中,从而使多数选民的支持者当选。前面按下不表的戈尔失败的另一个原因,就是有人认为有跟戈尔政见类似的耐德的参与,他分散了部分戈尔的选票。

    可以对此问题有所改善的方案叫做“二选制”。

方案2:二选制,每人一票,如果无人获得大于50%的支持,则将得票最高的两个候选人拿出来,再进行一轮选举,得票多的人获胜。

    法国总统选举就是这样的二选制,但是这样的方法只能改善“鹬蚌困局”,而不能彻底解决,2002年的法国总统大选就出现了类似的情况,当时支持左派政见的民众较多,然而在二选制下,最终的前两名却是一个右派和一个极右派。出现这种情况的原因是当年有16个总统候选人,且多数是持左派政见者,这样就导致左派的票极端分散。

方案3:n选制,每人一票,如果无人获得大于50%的支持,则去掉支持最少的候选人,再进行一轮投票,若依旧无人获得大于50%的支持,再去掉得票最少的候选人,直到有人大于50%支持为止。

    2001年奥委会决定北京为2008年奥运会主办城市的时候,就是用的这样的制度,在第一轮投票里大阪被淘汰,北京在第二轮就获得了半数以上的支持,从而当选。

    n选制的问题在于不实用,如果是奥委会这种只有几百个人投票的情况还可以使用,如果类似前面法国总统选举,有16个候选人,举国上下最多可能进行15次投票,成本太高。

方案4:即刻复选制,每个民众对候选人进行排序,如果某个候选人获得了50%以上的首选,则直接获得胜利,否则淘汰票数最低的候选人,并且把票数最低候选人的得票中的第二候选人拿出来,分给对应的候选人,如果有人获得50%以上,则当选,否则再淘汰一位最低的,并且把他票分给里面排序最高的且未被淘汰的候选人,如此往复。

    爱尔兰总统选举和伦敦市长选举采用的是类似的方案,此方案也有问题,试想如此场景:选民共10人,中间派候选人是3人的首选,左派和右派的候选人分别是4人的首选,当然左派选民最讨厌右派候选人,而右派选民也最讨厌左派候选人,而左派右派的民众对中间派候选人倒是都可以接受,不管是即可复选制还是n选制,中间派候选人都会在第一轮被淘汰。而中间派候选人则是全体民众都可以接受的人,也最能调和各派之间矛盾,最和谐。

    这个方案的本质问题是,虽然每个选民可以对候选人排序,但是在第一轮的时候却只考虑了第一选,没有考虑选民的二、三选。

方案5:上行复选制,跟方案4类似,只不过第一轮淘汰的不是支持最少,而是反对最多的候选人(获得最多末选票的候选人)

    再看上面提到的情况,中间派候选人由于不是任何人的末选,所以第一轮淘汰的是左派或者右派,再第二轮选举中,中间派的候选人就可以获胜了。

    方案5也有方案5的问题,考虑这样一种情况,只有两个候选人AB参选,选民9人,其中6人喜欢A而讨厌B,3人喜欢B而讨厌A,无论按照之前的哪种方式,都会是A获胜。但是现在又多了两个候选人C和D,喜欢B的3人中,都是把A列在最后一个候选的,而喜欢A的6人的末选,却是BCD各2票,这样,在第一轮选举中,A就由于获得了最多的末选票被淘汰了,而通过精心的构造例子,完全可以使B最终当选。仅仅由于CD参选或者不参选,A和B之间的胜负关系就发生了大逆转。

    实际使用此方案的例子不多,只有在公元前507年的雅典有类似的方案,不是让民众投支持票,而是投反对票,把反对最多的人投出局。

方案6:多赛制,民众对候选人排序,然后候选人之间两两pk,统计每一张选票上看候选人A在候选人B前面还是B在A前面,如此找到获胜场次最多的候选人来赢得选举。

    这样的问题是可能导致循环胜负,如ABC三个候选人,有3个民众,投票分别是ABC,BCA,CAB,可以看出AB之间A获胜两次,A>B;BC之间B获胜两次,B>C,AC之间C获胜两次,C>A,这样就构成了一个A>B>C的循环。这个是不是有点像足球联赛的记分制啊,如果积分相同,足球比赛中可以再看净胜球、进球、胜负关系等,但是作者并没有在这个方面进行展开,而是介绍了另一种方式:博达制。

方案7:博达制,民众对候选人排序,假如有n个候选人,第一位的候选人得n分,第二位得n-1分,以此类推,然后统计每个候选人的总分,获得最多分的获胜。

    有人对博达制的批评是:可能有选民会利用这种方式进行作弊(投“策略票”),最支持B的候选人本来心目中的排序是B>A>C,但是由于相对A,他们还是更喜欢B,因此,为了把B拉上来,就得把A拉下去,他们的投票就变成了B>C>A。博达对此批评的回应是:我的制度只适用于诚实的投票者。

    而这本书的作者却认为博达制的“策略票”问题没那么严重,如果无法准确预测民意和精确控制策略票的投法,有可能因为用力过猛,不但把A拉下来了,反而让C获得的支持票增加,这样就使得最支持B的那些人的“策略票”反而使得他们最讨厌的C当选了,当年在IMDB上就发生过类似一幕:

    电影《蝙蝠侠6》上映后,蝙蝠侠的粉丝们觉得这部片太酷了,于是就想把蝙蝠侠6投成IMDB第一位,于是他们疯狂的给蝙蝠侠6打高分,而同时,也纷纷的给当时的IMDB第一《教父》投低分,导致的结果就是用力过猛,教父变成了第三名,原来的第二肖申克的救赎(TSR)变成了第二(原来的第二是排在教父后面,新的第二是排在蝙蝠侠6后面),而后来,随着疯狂粉丝的热情消退,理性的意见占据了上风,蝙蝠侠6的得分逐渐下降,跌到了第10。而教父还是在肖申克的救赎后面,很久没有回去了。

    博达制是否有其他问题呢?

    以上只是对这本书第14章的一个笔记,也仅仅针对“多候选人单职位”问题进行了讨论,书的后面还会对“多候选人多职位”的情况继续探讨,也就是根据每个人对候选人的排序,来决定最终的候选人排序。

    回到搜索引擎领域来,如上策略的变迁会给我们一些启示,先看看之前抽象出来的问题:

    有n个候选人,每个选民对这n个候选人投票,最终在n个候选人中选出最合适、最符合民意、也符合逻辑的那个人。

    这很像搜索引擎在解决的问题:

    系统里有n个网页,有m个特征(页面质量、页面内容丰富度、页面超链、文本相关性等)对n个网页有不同的打分,如何根据这些特征的“投票”,选出最适合放在第一位的网页呢?

    从选举的例子中,我们可以得到的几个启示:

    1. 设计算法时,要避免出现“赢者通吃”带来的信息丢失问题。

    2. 不要因为某几个特征特别好,就把某个网页排到最前,或者因为某几个特征特别差,就把某个网页抛弃。

    3. 最合适放在首位的网页不一定是在每个特征上都最好,而应该是能够兼顾所有特征,综合表现最好的那个。

    4. 搜索引擎使用者对搜索结果的点击行为,可以看成是对搜索结果进行的“投票”,这样的“投票”信息的使用方式,也要注意考虑是否会带来选举过程中出现的种种不合理。

    以上提到的种种选举方案,仅仅是对“多候选人单职位的”的情况进行讨论,而搜索引擎面对的问题,则更类似于“多候选人排序”的情况,也即:

    系统里有n个网页,有m个特征(页面质量、页面内容丰富度、页面超链、文本相关性等)对n个网页有不同的打分,如何根据这些特征的“投票”,决定n个网页的顺序?

    而这个“多候选人排序”问题,是有一个“不可能的民主”的理论的,该理论的大意是,“合理”的民主应该满足3个条件:

    1. 如果选民都认为A比B好,那么最终结果应该也是A比B好

    2. 没有“独裁者”,也即,不存在这样一个人,无论别人怎么排序,最终结果的排序都和这个人的排序一致

    3. 无关因素独立性,也即,在第一次投票完成后,A排在B前面,现在进行第二次投票,如果所有人都没有改变自己投票中A和B的相对顺序,那最终结果应该也是A在B前面

    而通过数学的证明,可以得出结论:如果某种选举方式满足条件1和3,则必然不满足2,也即必然存在“独裁者”,这个问题的证明,可以参考这篇博客:http://roba.rushcj.com/?p=509

    根据“不可能的民主”理论,和搜索引擎结合起来看,似乎搜索引擎很难给出一个合理的网页排序,但是搜索引擎和投票又似乎有所不同,有两个角度可以破解

    1. 认为条件3过于强,需要弱化。

    2. 也许在网页排序问题上,真的存在这样一个“独裁特征”,这个“独裁特征”从目前看来,最适合的应该就是“用户满意度”了,按照用户的满意程度来排序网页,就是最合理的网页排序。如何衡量“用户满意度”呢?这就是我们一直在努力的。

转载自:http://stblog.baidu-tech.com/?p=1466

最近许多国外网站又不约而同的开始在谈论内容营销了,这个其实是自有网络营销行业以来,就已经存在的营销的重要一环。为什么突然又在谈论这个话题呢? 有什么特别的地方吗?

首先了解一下内容营销的定义:

内容营销就是指以创造内容或是分享内容给既有或是潜在的客户,来创造营销的效果,而这裡所说的内容,其实不仅限於网络上的,也不仅限於数位型态。

这篇”How to Build and Operate a Content Marketing Machine“提到,要进行内容营销,必须要有计划性的集合群体的创意,来产生有价值的内容。并且文章中提供了许多有价

值的建议以及方法。

这篇”7 Reasons Content Marketing is Better Than Link Building“则是说到,使用内容营销是比建立链接更好的一种方法。

为什么突然都在谈内容营销呢? 其实就是因為Google最近的大动作~Google Penguin Update(google企鹅计划) 。这个计划的推出对于黑帽和灰帽,打击动作是相当的大的,让许多网站开始不知所措。尤其是买链接做排名的站长,感觉到买链接也不是,不买链接也不是,因為买了链接怕被处罚,不买链接的话,又看到许多买链接的网站排名在你的前面。

因此很多SEO都处在这种纠结的情绪中,大家开始觉得还是专心在内容营销上面,这样觉得才是长久之计。
内容才是真正SEO的源头!

因为随着seo的越来越重要,因此企业必须训练具有文案写作能力的SEO人员,或是具有SEO概念的文案人员,总之内容的产出,最好是真正了解企业的内部人员。

内容优化或是内容营销,本来就是网站优化的重要一环,有内容才有办法进行下一步。所以不是SEO路走不下去,才要改走内容营销的,而是内容营销本来就是搜索引擎营销的一部分。

06月 5, 2012

关于百度基础算法分析,在我看来就是链接流行度核心算法+百度推广+框计算+开放平台,下面我具体的分析一下:

1.链接流行度:和大多数关键词搜索引擎一样,页面URL地址链接的流行程度为核心的基础核心算法;

2.百度推广:起先叫做百度竞价,后改为百度推广,包括关键词竞价算法和网盟推广算法两部分;

3.框计算:语义分析、行为分析、智能人机交互、海量基础算法等。

06月 3, 2012

火狐对于站长来说是一个必用的好工具,不但是因为其清晰的界面,还包括火狐用于网站优化的SEO工具!值得期待的是火狐13浏览器将在明天正式推出。但是,火狐已经向其服务器上载了一个候选发布版。这个新版本很可能在6月4日推出。在这里本人经过多方了解,终于知道了其一些功能上的变化,在这里给大家分享一下!

火狐13的修改包括:

1、会有一个设计更好的主页,可以访问包括下载历史、书签、浏览历史和浏览器设置等重要的方面。

2、网页重新设计还扩展到新的选项卡,上面有许多访问最多的网页或者最频繁访问的网页的缩略图。

3、采用根据需要装载选项卡的方式,火狐13减少了启动时间,因为它不再一次性装载所有的选项卡,而是用户访问这些选项卡的时候再装载。

4、还有配置重置功能,该功能可帮助用户恢复火狐浏览器的默认设置并且不会丢失书签、口令、cookie和格式数据。

5、同时也增加了包括更好的开发者工具和默认的支持SPDY协议。

很期待火狐13在明天的发布!