2010-04-22

还是看到百度俱乐部的一问一答。

huanbinliu问:js代码弹窗是否会影响自然排名

Lee答:任何对用户体验有增益或者减益的做法,其实会影响到用户的”投票”行为。而这些投票行为,又会影响搜索引擎对这个网站的评价算法。所以,弹不弹 窗并不重要呀,关键是这种弹窗会对用户造成什么样的影响。

很不解:如果搜索引擎跟着用户体验走,那用户体验跟着什么走?用户?一部分用户?还是大多数用户?因为我们知道,用户体验它是一个很感性的东西。比如, 欧就不喜欢门户上的花里胡哨,只钟情于搜索引擎的干净整洁,想找什么找什么 。所以,这是一个根本没法说清楚的东西。

搜索引擎肯定有自己的内部的算法机制,也肯定是基于用户体验为核心的。但“用户体验”之论是一个放之四海而皆准的调 调,就好比“为人民服务”这么一句口号,你喊一喊是可以的。但嘴上喊的同时不能忘了手上是要干的。

而我们站长,现在正是需要这种能够指导我们手上干的实货!

Tags: ,,.
2009-09-03

现如今,有这么一部分人,专门在网上搞一些“移花接木”的伪原创,然后在其中插入自己的链接,从而,希望得到搜索引擎算法的赏赐。今天,只想冷冰冰的送上一句:“伪哥”,你们能不能先划上一个句号呀?

试想,别人一天辛苦加倍的拿出自己的时间和精力写自己的经验和体会,而你简单的一个Ctrl+C在几分钟内就收获了别人所有的辛苦和汗水。如果,搜索引擎再不认出来的话,还会有多少人去坚持他的原创?更可恨的是,现在好多门户型的网站/网页,本身权重就高,已经得到了搜索引擎的认可,这样,最终的结果是,你的原创远远排在他的非原创之后。甚至都找不到。这一点都不奇怪,我们现在网络上大部分流行的知名文章,有水平的文章,一般是不知道原创作者是谁。当然,这其中会牵扯到网络知识产权保护问题。但那个东西真正的要实行起来(更别说在中国这个无视知识权为何物的国度),可能我们的合法产权早都被人连皮都剥削光了。

所以,能够更好的“保护”一些原创作者的真实内容,搜索引擎还是有必要改变一下算法的,不难理解,只为了分得一杯本应该属于他的那一杯羹。同时,境化我们的网络环境和自己公司的信任威度。

根据Google的PR算法,观察许久,它是以一张网页的外链个数来决定此网页的价值取向的,也就是说,一篇文章好不好,Google的回答很简单:就是看有多少人引用了这个链接,多少页面给它加了分。这时,我们就要问了,如果我们的原创内容,被权重高的网站转载了,它完全可以凭借自己先天点击率的优势得到大量的外部引用和链接,最后,在搜索引擎的相关结果中得到最靠前的排名,是不是跟我们原来的那篇原创就没有任何关系了?答:对嘀。这就是最可恨最可恶的抄袭!!!不仅跟用户想找的最终结果截然相反,而且还为自己的网站赢得了名(知名度),取得了利(点击量)。

目前,Google的算法还无法很好的区分网页中的超链和网页主题是否相关,这样,就会造成一个很滑稽的问题(移主易题),也就是跟我们用户想搜索的一点边都占不上了。比如:我们想要检索一下有关“马”的网页,最终给出的结果,排在最前边的都是一些不是“说马”的网站。大家不相信的话,随便到网上查一下,这也是最近在做一个“肉牛”网时发现的,搜索一“牛”,第一个就是新浪,而且不是说有关“牛”的信息,全是一些不合实际、只能牛人的“八卦”信息,一点价值都没有。实在想不明白,你新浪是一家科技公司,跟养牛的八杆子都打不着,为什么我们一找牛,你就会出来挡在前面充牛呢?你到底是真“牛”?还是装“牛”?

这也是Google算法的一个致命弊端,过于信任那些“旧日的网页和网站”,停靠这些“移花接木”的信息,来填充用户最后的搜索体验。所以,我们这些拼命写原创的,Google根本不会注意你。

突然想到一句话“学好数理化,不如有个好爸爸”,现在改正过来,“写好原创来,不如带个好PR”。呵呵~~~ 就到这儿。

Tags: ,.
2009-08-22

搭建一个网站,每个人都希望自己的相关排名关键词在搜索引擎上能够靠前,那么,在设计之初,必须考虑搜索引擎网络爬虫的工作原理。关于搜索引擎网络爬虫的具体细节,可能就涉及到商业机密问题,欧也是知之甚少,但我们不妨可以从其一般工作原理中获得几点启示。

网络蜘蛛爬虫是沿着从网页文本中提取出来的链接爬行的,任何一个网站都应含有足够相关的链接,以便爬虫能够发现该站点所有的网页。更具体的讲,爬虫很可能从网站的首页开始爬行,因此,网站首页上的链接应该包含该站的所有网页链接。另外,这些链接还必须是包含在网页的HTML中,而且必须是标准的HTML(比如,使用锚点标签),因为网络蜘蛛爬虫至少目前不可能识别其他格式的链接,包括JAVA或JavaScript格式。

许多网站从未被任何搜索引擎发现过,站长们要想把自己的网站品牌打出去,至少应该学着怎么让搜索引擎的“蜘蛛爬虫”发现。某些搜索引擎有URL提交功能,即允许设计者们将其网站的URL提交到爬行列表中,所有的主流搜索引擎都有这一功能;有些搜索引擎虽没有此功能,但如果已经被索引过的网站中有指向未被索引到的网站的链接,那么顺着链接,爬虫也能爬取该网站。因此,对于新网站而言,应该确保至少有一个已经被主流搜索引擎索引到的网站链接到该网站。比如:我们的老大Google。

一个网页中的文本内容对搜索引擎来说,比对用户更为重要。有些网页中的文本内容与链接主题毫无关联,为什么?就是这些网站里有些内容不愿被搜索引擎索引到,所以,他们在设计时专门提防着搜索引擎。此时请注意,我们需要区分“爬行”和“索引”这两个概念。爬行一个网站是指沿着链接访问该站点上所有的页面,且一般会为这些网页保存一个复本。索引则是爬行的下一个阶段,即将网页文本存人到一个特殊的“倒排文档”数据库中,利用“倒排文档”数据库,可以快速搜索到与用户所查询关键词相匹配的页面。标准搜索引擎一般只索引网页文本,而忽略图片和其他多媒体信息。因此,讨论搜索时就应该区分文本和图片。

用户在访问网站的时候,从图片中获得的信息比从文本中获得的信息更直观。譬如:一个来自知名公司的图标放在页面中显眼的位置,就足以说明该网页是该公司的。相反,搜索引擎则是忽略所有图片的,至少在从网页中提取信息时是这样的。如果一个网页上都是手机的图片,但其文本中却没有一个“手机”字样,或是全打上一些不相关的文字;比如:什么短信群发,什么长途话费等等等等。那么,搜索引擎不知道这个页面是关于手机的。说明了什么?这就说明,网站在设计之初需要确保页面中含有与该站点主题相关联的文字性内容描述。

除此之外,还有一个办法,那就是我们手动来帮助搜索引擎判断该页面是关于手机的。我们的老大Google首先提出了这样的方法:如果有其他页面链接到含有手机图片的页面,且锚文本中也提到手机,这便证明该图片页面是和手机是有关联的。另外,有一些精细的方法,如潜在语义分析,可以根据主题同义词,或其他与主题相关的词来猜测一个网页的主题。例如,如果一个页面中含有“移动电话”,或其他与手机相关的词(如“手机卡”和“手机号码”);那么,这便足以说明该页面是和手机相关的。

然而,可悲的是,网页设计者们不能依赖这些先进的搜索引擎技术,因此,除了他们站点的关键页面中含有一些与主题相关的文本信息,可以吸引访问者外。其他的的一无所有。

Tags: ,,.
2009-08-11

如果真的有那么一个一杀百杀、一统全局、节省人力、物力、精力、财力的推广手段多好啊!

几乎所有引擎都要遵循两条安身立命的原则:一是搜索引擎总希望能把最好最优秀的网站排在搜索结果前面;二是搜索结果的排序不由人工审核,而是由“机器”根据规则和算法自动完成。为什么现在主流搜索引擎都摈弃人工审核来排序?很简单,因为一方面网络上的海量信息量实在太大(不像十多年前那样的单纯),如果搜索引擎公司雇人工来进行审核,人员工资就不用说了,光管理这么一个天大的团队就把你拖死了,你还怎么去跟同行竞争?另一方面人工审核容易带有个人的感情色彩,不利于与结果的客观公证。所以搜索引擎公司只会制定规则和算法,按照它所制定的规则和算法由机器自动完成排序。

有了以上这两项基本规则,网站优化首先就有了它赖以生存的根基。网站优化在本质(也就是我们为什么要优化网站)小欧言简意赅的理解为:做好你网站的内容(让别人知道你是干嘛嘀);提升你网站的价值(让别人知道你是可以帮助他嘀);最后就是网站的结构、程序、内容设置符合搜索引擎检索排序的规则和算法(这点要因时因地因站而论了),从而获得搜索引擎的认可。没必要长篇大论,就这么简单。搜索引擎是永远不会排斥优化,这点我们完全可以放心,为什么?

因为优化其实是在帮搜索引擎提供好的内容并方便它检索,进而增长他的客户群体。试想,有这么傻的人吗?一举多得各取所需的买卖,搜索引擎怎么会不欢迎呢?这点Google的态度十分明朗(百度可能还在为自己的竞价排名打着小算盘呢),公开的表示支持和鼓励网站优化,甚至在Google的网站上就有一些关于网站优化的技巧介绍。这不,最近又写了一篇要加快网页速度的文章。(详情请登录Google网站管理员博客)

何为网站优化的最基本要点,三点

1.内容

内容永远永远都是搜索引擎抓取网页最基本的实证,这里我们说到内容,其实就包括你的网站定位(你想干什么),客户群体(你要干什么),以及潜在的广告客户(你能干什么),未来可预期的收益等等。

不同的内容,会吸引不同的用户。这点从最近”校内”改名”到”人人”就可见端倪。

2.结构

网站之间页面与页面是如何组织的?如何链接的?如何交互的?这里牵涉到网站的架构,用户体验以及网站粘度等等。

3.外链

提起外链,可能很多朋友笑了,也有很多朋友哭了,原因就在于外部链接上耗费了很大的时间和精力,结果还是不尽人意。的确,在Google PageRank的算法中,外链给予很高的权重,只有外链有效内容相关的链接,才会有益于排名。在此,也奉劝那些经常发一些垃圾链接的朋友们,该动动脑袋瓜了,网站优化是一项很烦琐需要极强耐心的工程活,只想凭一时冲动,一夜排名,那是很天真嘀。

Tags: ,,.
2009-08-03

虽然企业普遍希望有一个与网站内容相关的网址,类似于他们的名字-尤其是如果他们有一个强大的品牌-这并非总是如此,但搜索引擎优化 ( SEO )的专家说,一个明确的域名是重要的,可以真实反映网站所卖产品。

Domain Name Wire ,专栏作家写到, HubShout联合创始人亚当特泽写有大量的游客到了谁的网站,通过与域名相关的网址。这意味着人们确实输入一个名称到地址栏中,希望他们会发现他们要找的内容。但是,随着每天.com域名数量的消失。Seltzer 说,人们的投资领域应该进入实践搜索引擎优化( SEO ) 。

“曝光[ M ] Ÿ第一反应是,域名应该作为搜索引擎优化投资的下一个极好的战略,以增加收入, ”Seltzer写道。

“我访问的一些暂停的域名通常有非常简单的结构和内容没有建立真正的搜索引擎优化, ”他继续说。 “对我来说这似乎是一个巨大的机会。 ”

Seltzer的思考型“的”流量作了说明去年年底时的广告从汉堡王错过了网络流量,因为许多人输入错误的URL 。 Google search.该快餐连锁店的Whopper贞女活动包括微型,但根据去年12月的一份报告从AdvertisingAge ,许多人错过了,因为他们将网站输入“ whopper处女地” -减去的“ S ” -作为域名或成谷歌搜索。

Tags: ,.
2009-08-01

对于网站的更新和收录,搜索引擎都有它们各自的规律。因此每一次网站的更新收录,都牵动着每一个网站运营者的神经。因为更新收录是百度排名和Google排名的基础,当然每一个网站的自身情况不一样,更新收录也不能一概而论的。根据互联网实战专家的细心观察与对照,总结出百度、Google的更新收录规律与现象。现中国B2B研究中心将研究成果披露如下:

1、百度更新及收录是根据你网站的质量和更新速度的变化而变化的,你快它也快,你慢它也慢;而Google更新则比较“稳重”,基本上是一周一更新,对于企业网站来说。如果是大门户网上,可能Google更新和收录的情况会不一样。许多网站运营者在进行百度优化和Google优化的时候,就会经常想着,到底是百度更新更快还是Google更新更快?呵呵,个人觉得这不是一个绝对数。

2、百度对原创文章的重视程度比Google更加重视,对于一个完全相同内容的网站,在Google已经收录了上千个网页,而百度则还site不到信息。百度对收录质量也在不断提高,早几年以前都说百度收录的数量很浮夸,而现在,很多大网站的收录数量被砍一半,甚至远远低于Google的收录数量。这一举动也说明百度在改变收录标准和更新标准。

3、令百度优化者经常头疼的事就是自己的网站经常被百度“k”,轻则K过首页,重则K掉其它更多的页面,甚至一毛不留。这是百度对于百度优化作弊者的一种惩罚机制。而且会有一种连带责任。如果某个网站被k,而你的网站有指向它的友情链接,那么你的网站也会被“K”。而且不会事先通知你。出现被“K”是很痛苦的事,如果你不采取补救措施,那么就可能一直“K”之下去。最后你的网站会被踢出百度之门。

一、百度搜索引擎的特点

1.基于字词结合的信息处理方式。巧妙解决了中文信息的理解问题,极大地提高了搜索的准确性和查全率。

2.支持主流的中文编码标准。包括GBK(汉字内码扩展规范)、GB2312(简体)、BIG5(繁体),并且能够在不同的编码之间转换。

3.智能相关度算法。采用了基于内容和基于超链分析相结合的方法进行相关度评价,能够客观分析网页所包含的信息,从而最大限度保证了检索结果相关性。

4.检索结果能标示丰富的网页属性(如标题、网址、时间、大小、编码、摘要等),并突出用户的查询串,便于用户判断是否阅读原文。

5.百度搜索支持二次检索(又称渐进检索或逼进检索)。可在上次检索结果中继续检索,逐步缩小查找范围,直至达到最小、最准确的结果集。利于用户更加方便地在海量信息中找到自己真正感兴趣的内容。

6.相关检索词智能推荐技术。在用户第一次检索后,会提示相关的检索词,帮助用户查找更相关的结果,统计表明可以促进检索量提升10-20%。

7.运用多线程技术、高效的搜索算法、稳定的UNIX平台、和本地化的服务器,保证了最快的响应速度。百度搜索引擎在中国境内提供搜索服务,可大大缩短检索的响应时间(一个检索的平均响应时间小于0.5秒)

8.可以提供一周、二周、四周等多种服务方式。可以在7天之内完成网页的更新,是目前更新时间最快、数据量最大的中文搜索引擎。

9.检索结果输出支持内容类聚、网站类聚、内容类聚+网站类聚等多种方式。支持用户选择时间范围,提高用户检索效率。

10.智能性、可扩展的搜索技术保证最快最多的收集互联网信息。拥有目前世界上最大的中文信息库,为用户提供最准确、最广泛、最具时效性的信息提供了坚实基础。

11.分布式结构、精心设计的优化算法、容错设计保证系统在大访问量下的高可用性、高扩展性、高性能和高稳定性。

12.高可配置性使得搜索服务能够满足不同用户的需求。

13.先进的网页动态摘要显示技术。

14.独有百度快照。

15.支持多种高级检索语法,使用户查询效率更高、结果更准。已支持“+”(AND)、“-”(NOT)、“|”(OR)、“site:”、“link:”,还将继续增加其它高效的搜索语法。

二、如何面对搜索引擎降权?

被baidu进行降权,甚至被封杀。这些问题是许许多多网站都曾遇见到过的,有些网站并没有进行恶意作弊,优化也是很正常的,是什么原因造成的这些问题?资深的互联网实战专家们对baidu的这一现象进行了深入地研究和分析认为:站在SEO的角度去想,主要是网站的自身原因。一个网站可能会因为结构的不合理性就会容易出现类似的问题。那么如何提升你的站点对搜索引擎的权重?或者是如何解决降权或封站问题呢?今天笔者将通过这篇文章与大家讨论研究。

面对降权要冷静分析,主要问题还是在与网站本身。所以要从网站开始,如果站点已经被降权了我们该怎么办?一般降权分为四种:1、站点部份收录内容减少;2、网站首页被屏蔽;3、网站外部链接减少;4、网站全部页面删除。

站点收录内容减少,面对此问题,首先应该考虑网站的内部链接是否存在过失,是不是网站内出现过多死链。网站首页被屏蔽,这类问题主要出现在BAIDU。这个问题解决比较简单,直接将服务器的主机头索引修改为其他页面。或将首页的文件名称重新修改。但是做这些的先决条件是这个页面没有进行过度优化。网站外部链接减少,主要是因为你站点的外部连接质量不高,搜索引擎再进行调整的时候将你的外部那些“垃圾”链接删除。所以一定要注重高质量外部资源。网站全部页面删除,这个问题是比较严重,一般出现了这个问题就意味着你的站点肯定存在很大问题。有可能是过度优化、有可能是网站结构等等。遇到这样的问题必须要将站点恢复原样,去掉多余链接修改网站框架结构。等待搜索引擎重新收录,一般这个周期会很长。如果这个站点域名不是很重要的话,可以考虑换掉域名,重新提交搜索引擎。

对于出现搜索引擎对网站降权(搜索引擎封闭站点的某个页面,或减少收录量,这就是我们经常说的降权)或封站(搜索引擎不收录该站点,或者将该站点在搜索引擎中的所有页面删除)问题,如果baidu只收录网站的首页。而GOOGLE收录效果却良好。解决这些问题根本上就是要先提升站点在搜索引擎中的权重,让搜索引擎认可您的站点。笔者在此总结了以下问题:

1.精代码:很多网站都为了自己页面的美观华丽,为了实现一些复杂的功能而使用很多繁琐的程序来进行控制,而且在部署使用这些程序的时候,非常不注意这些程序的工整性,经常没有任何原则的随便胡乱插入,这样会让搜索引擎非常困惑,没有思路。所以为了搜索引擎能够更好的收录您的站点,请放弃那些花哨或一些不实用的功能吧。

2.改结构:网站的结构也就是说网站的整体框架。有些网站,为了实现一些在线功能,一个页面出现了多个iframe.虽然搜索引擎都在进步,Google已经避免了此问题,但Baidu仍然不是很喜欢存在iframe的页面。对于网站的内部链接情况,一定要本着清楚明白、保持链接通畅、尽量不要出现死链坏链情况。对于出现死链问题(如果是自己的服务器),可以重新制定错误信息。定期使用GoogleWebmasterTools或Xenu来检查自己的站点。

说到网站的整体结构,有过SEO经验或营销型网站(从用户体验,到用户行为跟踪,再到最后销售为一体的网站)建设的人都知道,网站漂亮不是目的,目的是将网站的访问用户转换为网站的购买用户,让网站高效率被搜索引擎认可。而要做到这些,网站的结构是非常重要的。说的简单一些,网站结构就是让用户看到他想看的东西,让他能时刻找到想要的信息和产品,并随时找到你的联系方式。搜索引擎方面,让搜索引擎能够顺利通过页面的链接抓取到网站中的每个页面,具体方面如建立有效的链接导航,让每个页面都具备导航功能,能方便引擎,也能方便用户。建立网站地图,将重要的内容或目录在地图中体现。尽量使用XML页面。

3.重质量:网站应当具有一定的质量,如果一个网站不能给用户提供有价值的信息和内容,会被搜索引擎大打折扣,搜索引擎也一样很注重网站内容、页面质量,内部链接、外部链接质量和网站最终页面质量。网站的优质内容在优化中占据很大比重!既然内容很重要,应该怎样去创造优质内容呢?搜索引擎读取文章只能把网页中的内容分离,分别建立索引,然后通过分词等技术对内容进行机器编译。再后是用户使用引擎搜索相关关键词,搜索引擎提供内容。按照它对页面网站的权重、唯一性等将网站或相关页面提前或靠后,展示给用户。所以对于优质内容来说尽量使用原创内容。每个人的写作方式都是不同的,所体现出来的断词形式,也肯定不同,所以尽量保证内容的原创唯一性。页面质量,指的是最终的终端页面质量,内容也算其一了。很多网站都有自己的新闻页面,这个页面可以说是终端页面了,但是站长都会忘记增加此类页面的关键词和一些最基本的meta标记,具体标记就不说了,真的应该注意一下。但切记不要滥用。Baidu的贴吧、知道、词条,可以说是Baidu的几大产品中最有意义的,这几个产品创造了很多唯一独立内容,而且很多内容都是按照中国人的搜索习惯研制的。也可以说这几个产品为各大搜索引擎都提供了比较好的内容。

搜索引擎的进步体现在不断的为用户提供更高质量内容,并且会更注重网站的时效性,搜索引擎会把最新的新闻相关内容提高到搜索引擎搜索结果前面,尤其是新闻搜索。这块做好之后,也可以给你的站点带来一些流量,一些客户。如何来优化网站实效性呢?如何让搜索引擎更快收录到我的新闻终端页面呢?首先要保证的是网站在搜索引擎中的权重,你的站点与搜索引擎必须要有个良好的“合作”关系。让Spider们及时去关注自己的网站,甚至驻留Spider,这你就成功了!主要通过高质量外部资源来托起你的站点。网站页面本身应该注意代码简单,加入应有标记,保持良好链接。还有一点非常重要,那就是新闻页面的名称或目录。页面文件名来尽量使用NEWS071109.HTML或071109.HTML这样的名字,因为这些具有时间代表的文件名称是搜索引擎判断新闻的一个重要条件。对于专题来说搜索引擎也非常喜欢,因为他存在唯一性和时效性,对于目录性的专题来说,搜索引擎也比较喜欢。对于内容,该使用H1的地方一定要使用,并且重点词进行加粗等等。

4.轻优化:你在做网站的时候,只要告诉你的设计人员SEO的几个大的原则(网络上有很多介绍SEO的文章,我在这里就不多说了),让他按照这几大原则去做就可以了。千万不要为了优化而优化,这样效果可能适得其反。也不要累积关键词,为了扩大自己外链而疯狂的增加链接。我有很多客户的网站都因此而付出了很大的代价,换来的是搜索引擎对网站的降权,才去找原因。

5.增外链:一个网站有了完美的结构,具备营销而让搜索引擎高度认可的条件后,这就够了吗?错!笔者认为这是远远不够的。搜索引擎认可了,如果还要让它高度认可,这就需要外部链接了。外部链接也要注重质量。一个新站点,就不要在乎你的外部链接是否是高质量了。你只要找一些结构合理,不存在欺骗性,不存在过度优化的站点去交换链接好了。因为这些站点都是具备一定潜力的站点,有可能将来就会成为一个高权重的站点。如果网站已经拥有了一些搜索引擎方面的权重,那么在选择外部链接的时候就应该注意一下了,绝对不能与被降权的站点进行链接交换和链接。还有一点,就是不要吝啬你的链接,适当去为一些低权重,高质量的网站进行链接。处处留心,当你看到可以发布自己网站链接的地方一定要发布。但千万不要在那些贴满链接的留言本、论坛等地方发布。还有就是多多加入目录,现在国内有很多非常好的中文目录(详情看此贴:全球各大搜索引擎提交目录),如果能加入国外的目录引擎也可以。
(阅读全文……)

Tags: ,,,.