2012-03-31

问:为什么平时几乎搜不到点点网个人空间的内容

答:site一下diandian.com,你会发现有约345万个收录,但翻到76页,看到的都是点点网用户的子域名(也就是个人主页),但你打开这些用户的robots.txt文件,并没有发现任何有屏蔽百度的迹象。如我的空间文件:http://xiaoo.diandian.com/robots.txt

打开后将会发现,点点为了协助搜索引擎的收录,还专门写了一条语句:Sitemap: http://xiaoo.diandian.com/sitemap.xml(为用户内容自动生成的地图)

我们再到diandian.com/robots.txt这个文件下看,除了倒数第二行有条【Disallow: /dianlog/】的命令外,没有任何屏蔽迹象。(这里面放得都是用户的帐号ID和编辑页面,可能是为了用户的安全而考虑)

而最终用户生成的页面为这样的结构形式【http://xiaoo.diandian.com/post/2012-03-29/17370771】,看到了没,用户的内容都在post这个目录下面放着,也就是说,跟上面那个dianlog目录根本无关。

这也是好多以内容为驱动的门户类不愿意建立二级域名的主要原因,就是怕搜索引擎能力有限,抓不到那么深。最好的例子是Google一下

由此证明,不是点点不想,而是百度不能

Tags: ,,,.
2010-08-15

刚刚请教前搜房网SEO回来就看到王通的这篇帖子,说是国内最牛逼的SEO技术是百度。我觉得这句话百分之九十五在扯淡,如果改成:国内最牛逼的SEO资源是百度,或许倒还是有些参考价值。

王通特意从百度百科的“电子商务”的PR值、Title、keywords、description、反向链接、网页内容、网页排版、内部链接去试图解读百度的SEO牛逼技术。(具体请看王通原文)

先抛开百度是国内第一搜索老大不谈,域名从1999年10月11号开始注册至今,请问国内搞电子商务的网站有几个能与之对抗?

再者说,百度百科何许之物也?那是百度的患难心腹呀,别说你是去搜电子商务,差不多凡是搜一些三四字左右的都是百科当魁其首。

再看它的Title、Kw、Dp等等是百度设计好的一套模版,内容更不是由百度内部去控制,那都是由网民自发填上去的。所以,我倒想问一下,王通先生为何不从“电子商务”内容的关键词的密度方面去解释一下呢

再看百度需要反向链接吗?完全不需要。

几乎每个词条下面都是它们相关的词链,更别说百度的其他产品,比如百度知道,时不时的能从知道里看到百科的链接。

贴吧、百科、知道这三个绝世之“品”,几乎涵盖了互联网信息的方方面面;这,是人家的资源呀。

不信各位试一下,把王通给你说的所有百科上的SEO技术原封不动拿到你的网站,看何年何月能排到第一,然后再创造一个热词,随便填上一些内容想办法通过百度审核,其余工作一概不用,看看一周之后是不是第一?

古人打仗前有句话说:兵马未动,粮草先行。不是说强兵强将不重要,而是说比兵将更重要的是支持这些兵将们在前线征战的后备资源,所以,说白了,最后打的是经济,打的是银子和黄金,而这些都是一个国家国库中的资源。

网站优化形同一场争战,而且是一场持久战。不能说技术不重要,只能说资源更重要

打死我都不相信百度的SEO技术比Google强,可是我又不能不承认百度在中国这片土地上不比Google强。

百度的战场从1999年打到至今,已经打了快11年了;而Google呢,从2005年4月远渡重洋来到中国,如履薄冰,艰难逾越十九道“门坎”,最后,还是在2010年1月退出中国大陆

满打满算,前后不到四年,将来Google在港的结局如何,谁也无法预料(PS:请原谅以前的无知,因为就Google退出这一事曾大骂其借百度被黑之势在炒作,现在真相大白了,总有些脸红)。

这是其两大搜索巨人所发展的简短历史背景,而王通先生却忽略这一点儿。

什么时候,你在Google搜索“E-commerce”能看到百科排名第一,那才算是百度在SEO技术方面的能耐。

退一万步说,Google的SEO技术果真很垃圾,那请问,Google从2005年以来推出的一系列中文站长优化工具又如何解释呢?怎么?Google不懂SEO但却能开发出SEO工具

直到现在,只要一有空,我都在读Google的网站站长指南,这才是Google的雄才大气,他不怕别的网站超过了它,哪怕是自己的对手——百度。

如果Google在中国也有十来年的平稳发展;如果Google也像百度那样对互联网上的东西一摊子全揽(比如:弄一个什么Google百科、Google知道和Google贴吧);如果Google也像百度那样涉及到SEO的技术避而不谈;

我想,百度现在几乎就成了百毒了,因为,只有在一个公平的竞争环境下才能显现出谁的伟大和谁的恶毒

所以,SEO拼到最后拼的不是技术,而是资源,而百度的11年之积累,恰恰具备这样对抗Google的“资源”。不是Google技术不行,而是Google资源不足。

更可悲的是,百度现在占据着自己得天独厚的“三品”资源,在SEO界甚至互联网内呼风唤雨,几乎成垄断局势,无人能与之争锋,更别说那些可怜的SEOer了。

而就是这样,前些天Lee先生还要用个人站长的用户体验不好来替百度狡辩一番;今天,王通先生却拿Google的SEO技术不行来给百度美言一把。真他妈的胆大不嫌寒颤,放屁还装腼腆。

题外之言:要我看,王通先生的这篇帖子重点不是在给我等草根灌输什么SEO绝活,而是打着羊头卖狗肉,给自己的电子商务关键词加些链接,我们就将就着看吧,他不说些百度的好话,百度能给它收录吗?

请恕无礼,今天冒犯龙威,还望恕罪。

Tags: ,,,,,,,.
2009-10-13

最近,有这么一股风,说什么Google不再重视分类目录的提交权重。为此,好多SEO专家展开了讨论。有些专家称:分类目录中有很多跟目标网站根本不搭界,纯粹在利用分类目录的权重来间接作弊,会给网站搜索引擎优化的结果带来很负面的影响,所以,建议Google删除。

理论上,我们都知道,这些目录真的能给我们的网站排名优化稍稍带来一些效果,正因为如此,所以才在一时间涌现出那么多的分类目录被当作宝贝疙瘩捧在手上,这是其一。再来就是可以无形中增加自个网站的反向链接,更好的打入同行链接圈内。从而,增加自身网站的影响力度。

可能也是如此,Google才开始对重要分类目录提交进行鉴别,当然,无形会影响到我们的排名结果。这时,我们会问,你Google是不是想建立一个跟DMOZ类似的目录呢?对此,Google官方发言人没有作出相应的回答。

欧觉得,不管是提交高质量的分类还是残次品的垃圾,还是首先要把自己的网站打造一个至少远离垃圾的站,这样,不管是哪家的搜索引擎要变动随便它好了,我们还紧张什么呢?

Tags: ,.
2009-08-20

基于链接的排序算法似乎已广泛应用到各种商业搜索引擎中。为了让设计出来的网站能够在各种搜索引擎中获得较高排名,Seoer应该知道这些算法的原理。Google的成功意味着PageRank算法值得特别的关注。PageRank算法是少数几个公开的排序算法之一。PageRank算法对数学要求很高,但可以做些简单的解释,以分析它对网络空间的影响。搜索引擎的其他排序算法也可能获得与PageRank算法相同的结果,尽管他们没有公开任何与其相关的信息。HITS算法是另一个基于链接的排序算法,与PageRank算法形成鲜明对比,下面的引述概括了链接对于搜索引擎的价值。 “通过分析网页间的链接关系,搜索引擎可以判定出一个网页是关于什么的,也可以判断它是否很重要并值得列入排序列表中去。”

搜索引擎在排序过程中不考虑链接因素,而使用一个基于关键词词频的公式,该公式在潜在匹配文档中统计以用户为中心的查询的关键词的词频。例如,检索“牛”时,引擎可能返回文档标题、头部和正文或是在URL中出现该词语的所有网页。这种排序算法可能无法判定哪些是关于“牛”的最权威的网页,而只能判定哪些页面中与“牛”相关的词语最多。但PageRank算法却可以通过链接结构,判别出哪个是最权威的网页——排名位于最前面的那个,即拥有最多入链的网页。这就使得引擎能够返回一个真正的权威网页,而不是一个类似于“牛”课程表的网页。

1998年Google的PageRank算法的设计者和奠基者Brin和Page将其核心部分公开。随后,在1999年他们和Motwani、Winogriad对其进行了更为详细地阐述。直到2004年,该算法仍在使用,只是作为一个更大规模的算法集的一部分,该算法集采用100多个指标来判定网页是否和用户的查询相关,并对它们进行排序。Google官方声明:“虽然我们有许多工程师在为全面提高Google的各个方面而努力,但PageRank算法仍然是我们网络搜索工具技术的基础。”下面是支撑PageRank算法的两个基本理念:

·人链是衡量目标网页重要性的很好的指标。

·源于重要网页(通常说的高权重)的人链比源于次要网页的人链更能说明该网页的重要性。

欧将对PageRank算法进行阐述。在这里,使用Google网站和其他地方所用的“投票”这一比喻代替原来的“随机冲浪”一词所表达的含义。

在一个简单的基于链接的投票系统中,可以给每个网页投票,并允许网页将其一票平分后投给它所链接的网页,最后统计每个网页的最终票数便可形成一个排序系统。在这一过程中,拥有较多人链的网站能获得较高的票数。然而,这个简单的投票系统不足以说明问题。如受欢迎的列表网页的入链很多,就会获得很多投票,但该页面只有一票,可平分给它所链接的目标网页,这些目标网页中可能含有有价值的内容。重复这个投票过程,使得每个网页在前一轮中获得的票数平分给其目标网页。然而遗憾的是,当投票系统陷入死循环时,或遇到一个没有出链的网页时,投票的重复过程便无法进行下去了。

对此,Brin和Page提出的解决方案是,在每次投票时,网页回收一部分票数,而不全部传递给它的链接目标网页。他们建议保留15%的票数,这样,每次投票时,网页只将其85%的票数平分给其链接目标网页,而另外15%的票数供系统中所有的URL平分。运用数学算法可以有效地实现这一投票系统。重复这样的投票过程,直至所有网页的票数都趋于稳定,即在新的一轮投票中,网页票数的变化很小,这样,PageRank算法便诞生了。

有两种PageRank算法和修正算法,修正后的算法有明显的不同。实践中,Google采用的可能是PageRank修正算法。第一种修正算法是由Lifantsel在2000年提出的,即将PageRank的投票统计建立在网站的基础上,而不是对单个网页进行投票统计。第二种修正算法是由Page、Brin、Motwain和Winograd于1999年提出的,即自动赋予一个网站的首页较高的票数。Google似乎同时采用了这两种修正算法,可能是与基于网页的标准算法相结合,也可能是完全将其取代,但这些或许都只是一种猜测。

Tags: ,,,.
2009-08-18

随着最近Google推出代号为“咖啡因(Caffeine)”的新算法推出,以及雅虎跟微软的合作,雅虎要采用微软的算法。这一系列动作让做google和雅虎优化的网站优化公司毛骨悚然。

不是口出狂言,而是因为seo这个行业是依赖于搜索引擎生存的一个产业,搜索引擎的每一次小小变动都会牵动着每一位奋战在一线上Seoer者的心。于是大家就要问了,我们这些Seoer从业者依赖于搜索引擎的生存状态究竟会不会长久持续下去。小欧认为不会。为什么?两点:

随着互联网的发展,网页数量急剧增加。在纷繁复杂的网络世界,网民必须借助搜索引擎来梳理网络,找到自己最想要的信息。那么搜索引擎这一时代骄子在互联网时代将会一直存在下去。搜索引擎与互联网的关系就像刘备遇见了诸葛亮,时代发展之必然。这也是为什么微软拼了老命也要在搜索引擎上折腾一下,因为但凡大一点的公司,要做的事情必须是在整个时代具有非凡意义。搜索引擎正是这样一个有时代意义的产品。暂称之为“时代骄子”。

如果搜索引擎在互联网时代会一直存在下去,那么seo行业的存在就必不可少,不管搜索引擎技术发生怎么样的变革。因为在数以亿计的网页中,再高超的搜索引擎也难以做到不受任何人为影响,完全靠算法来及其公正的有序排列网页。那么在这种情况下,seo就永远会有他的生存空间。只是可能随着搜索引擎技术的革新,seo的工作内容会随着改变而已。

在国内,互联网的发展还才刚刚开始。搜索引擎的路还需要我们Seoer不断的进行创新和推动,大家完全不必担忧,甩开膀子干就是了。

Tags: ,,.
2009-08-14

想跟各位聊聊Google的Dance(孩子气)。几年前就已经耳闻到Dance任性的魅力,一直没有时间潜心陪这小家伙玩上一把,最近也是优化工作上的一些小麻烦,重新学习了一下Google的孩子气(Dance)。闲话少扯。直接入题。

1.Google Dance是什么?

Google Dance中文意思就是谷歌跳舞,也就是说Google每过一段就会有一次相对较大的调整,调整期间,很多网页的排名会有忽上忽下的不稳定(常常是今天还在Top10明天到第三页都找不到了),就像未成年的孩子一样,还没有定性。

2.Google Dance和PR之间有什么瓜隔?

Google Dance一次,PR值就更新一次,所以当你看到你的网页这几天PR值变化了,那么就说明Google这几天在dance,像今年的6月份,Googe的PR就更新了两次,好多名不见经传的博客一夜之间跨到了4甚至5,在这里也奉劝那些运气很好的朋友不要高兴地太早。因为Google正在耍小孩子脾气。呵呵~~

3.Google Dacne多久调皮一次?

2005年以前,Google是一个月一次Dacne,PR值一个月变化一次。后来因为作弊网站太多(全都是链接工厂,群发群链),Google为此特意调整了算法。现在差不多是每3个月任性一次。Google的意思很简单:亲爱的站长朋友们,请把你们的注意力从我的孩子(PR)转移到你的孩子(网站)上吧。

4.那我们怎么知道Google正在调皮呢?

3点:

1)、查看PR值的变化

2)、通过Google Dance工具查询(Google dance工具主要就是通过让你看到你的网站在google几个数据库中的排名,如果排名不一致,说明google正在dance)。如果还不清楚,最笨的办法就是试着打开Google的几个服务器,小欧经常打开5个来检测分别如下:

http://www.google.com

http://www2.google.com

http://www3.google.com

http://www4.google.com

http://www5.google.com

3)、通过查看自然搜索结果的变化(Google dance期间,搜索结果在一天之内可能就有非常多的变化,比如今天,小欧检测“笔记本”这个词,过上几个小时,可能就是一个新的排序)。

5. Google Dance调皮后是不是就成熟一些了(算法完善)?

有一定完善,不过主要还是大范围更新它的各个数据库。

6.如果 Google成熟了(算法变了),那我们做SEO的还怎么欺负(优化)它呀?

改天帮大家回答这个问题。

Tags: ,,,.
2009-08-06

百度很重视收录网站页面的更新频率,尤其重视原创内容,“如果一个网站某单一页面能做到及时的更新和有大量原创内容,那么即便它的网站整体表现并不太好,也能被百度及时抓取。”而谷歌则会更喜欢抓取那些网站整体效果以及综合表现(PR值)好的网站。

在对待网站的内、外部链接上,谷歌尤其重视外链。如果一个网站外链的数量、质量和链接相关性都做得好,那么谷歌会优先抓取。百度则没有那么重视外链。百度更重视网站内部链接之间的相关性,而谷歌重视的却是网站内部链接之间的PR传递。有意思的是,百度只抓取125K以下大小的网站页面,谷歌却能达到175K。

百度喜欢抓取标题在52个字符(约26个汉字)左右,而Meta Description在210个字符左右的网页。谷歌则喜欢抓取标题在65个字符左右,Meta Description在160个字符左右的网页。

下面看看搜索引擎如何看待网站地图:

对一些动态网站和 Google索引有问题的网站(比如:FLASH),如果你的站内部链接设计合理又有个标准的网站地图页的话,那就没必要用Google 网站地图。

要记住,一旦你注册参与 Google 网站地图的话,你就要定期的提交你的 XML 文件哦,这可要花你些时间的。

对于有一个比较乱,对搜索引擎不是那么友好的站,又不愿意把站重新弄好的站长来说,Google网站地图能起点帮助。不过花时间把站弄好,做好SEO让所有的搜索引擎完整的爬你的站比起不断的提交你的 XML 文件要有用的多,也重要的多。你或许能让 Google 更快的爬到你的新网页,但不意味着 Google会更快的给你的网页排名。其他的搜索引擎优化就更不用说了。

Tags: ,,.