这里是我SEO网站tianjin2008.com的笔记,SEO的知识来自于霍炬爱搞搞的文章,特此感谢,因为这是我第一次正式弄SEO,所以写成日记的形式,希望跟大家一起交流并的到高手的指导。

tianjin2008.com 中文名字叫做魅力天津,3月24日晚上7点多正式上线(我回家的时候同事还在搞)。

我没有敢在没上线的情况下提交 google ,于是25日上午提交了google。

26日

正式开始SEO工作,首先在google上用 site:tianjin2008.com 搜索了一下,没有搜索结果,用域名搜索,没有搜索结果。

用title全名搜索的时候,发现已经收录了1个首页。title的名字很别扭,叫做“魅力天津Tianjin2008”,由于天津跟英文字母Tianjin2008挨着,所以“天津”这个词没有被收录。

于是我修改了title的名字,改成了“魅力天津 – 天津的·世界的 – tianjin2008.com”,原因如下:

  • 魅力天津”是网站的核心关键词;
  • “天津的”这个词出镜率很高;
  • 为了先让网址被 google 快速认可,用了“tianjin2008.com”放在title里面

27日

今天最重要的工作就是根目录下加了个sitemap.xml并且提交给 google ,然后写了robot.txt 把Admin目录屏蔽掉,别让爬虫搜索到咱的后台,哈。

在 google 里搜索了一下,没有什么进展,还是什么也查不到,只能用title全称查到几个页面。我在自己能够加链接的地方都加入了 tianjin2008 的链接,希望能把爬虫引过去。

听说论坛上的宣传对于 google 来说没什么效果,就没有到处贴。等待中……

28日

灵机一动的好办法:流量不一定要来自于首页,我应该把网站上的所有文章链接都导入到sitemap.xml中去,而且随时增加和修改,于是写了一小段程序干这个事情。然后决定每天向 google 至少2次重新提交 sitemap.xml 教会爬虫如何搜索 tianjin2008 网站。

上午11点,我把一个包含2000多个链接的 sitemap 重新提交给 google ,等待。

下午去看,google 还没有重新下载新的sitemap文件。

跑去 google 一下,有进步,site:tianjin2008.com 有结果了,昨天提交的sitemap起到了效果。不过所有网页的title仍然是旧的(探讨:说明google虽然更新了链接,但是没有更新网页的数据??)

发现问题:tianjin2008.com上面的新闻最终页面,title 和 关键字 是固定的,我猜想这样对搜索到新闻不利,于是我将所有新闻最终页面的title改成:“魅力天津:新闻标题”的形式,关键字用新闻的简介代替。

不知道频繁地提交sitemap文件是否有好处,不管,重新生成sitemap,再提交一次,等待。。。。

奇迹,晚上稍晚一点,9点多,距离我提交sitemap文件8个小时,google里site:tianjin2008.com的结果变成了220个网页,虽然title又不对了,不过小有成果,收工。

29日

一早重新提交了sitemap文件,网址数量为3780个。查了一下,site:tianjin2008.com 已经收录了377个网页。将首页title修改成:“魅力天津 – 祝福天津2008,绽放天津的魅力 – tianjin2008.com”用意如下:

  • 更好听了;
  • 有三个核心关键词“ 天津 ”;
  • 有常用的派生关键词“天津的”;
  • 有网址 tianjin2008.com

发现现在更新sitemap后,google一般在2-3个小时内就会重新遍历sitemap文件。

为了与关键词“ 天津 ”更接近写,我在 tianjin2008.com首页制作了一个滚动新闻,其中有100条天津相关新闻在里面不断滚动。而且,这些天津新闻应该是爬虫除了关键词以外最早见到的文字了,爬虫,加油,我可不易啊。

其余似乎没有什么太多的事情可做,优化了一些网页,就是把网页前面的一些js代码弄到后面去,让爬虫来了就能看到带关键词有用的东西。

18点30分,关键词“魅力天津”从昨天的榜上无名升为首页第五名,google 最后一次下载sitemap文件的时间缩短为1个半小时,但所有网页的title和链接仍然没变,看来要记录以下 google 下载sitemap到更新网页的时间。

30日

昨天晚上爱搞搞给了我几条建议,跟大家分享:

  • 让我本篇blog里面给“魅力天津”加上超链接,她说别小看这篇blog,大家来看的时候就会帮我点一下。后来我考虑是不是加上google搜索结果的超链接,比如这个:“魅力天津”,这样大家就会点到google的搜索结果里面,然后帮我点一下,告诉google这个网站就是真正的魅力天津。
  • 还建议我用365kit自己摘自己,让更多人看到。
  • tianjin2008.com上用了好多旧站点的数据,其中有一个论坛,tiger说tianjin2008.com被google收得快和论坛数据真实很有关系,这一点我还没弄懂,赶明儿好好学习一下。

如果使用已有站点真实的数据可以让google快速收录的话,那么我们可以做以下大胆地假设:

  • 已知mop大杂烩的ip为61.135.170.238,我现在将 dzh.tianjin2008.com指向这个IP
  • 将网址 dah.tianjin2008.com 加入sitemap,定义重要度为 1
  • google爬虫认为tianjin2008.com站点有一个相当牛X的社区
  • google将同样重要度为1的tianjin2008.com首页提高排名(原因是大杂烩引用了首页)。

这样如果可行,那么应该是google的一个重要bug了,因为他只认识网址而不认识IP,(讨论题:google应该认识IP吗?)

今天上午10:30分,我将包含5000个网址的sitemap提交给google,google在3分钟后下载了这个文件,我尝试重新提交,3分钟后,google再次下载该文件。这说明,对于sitemap,google也是有评估的,不断变化的,准确的,能访问的sitemap文件是google喜欢的。所以,我每天增加1000个网址的sitemap应该是google爬虫喜欢的食物。

但是,site:tianjin2008.com下的网页数量只有微量增加,今日收录网页数量是385个,我估计google又在计算什么,为什么5000个网址的sitemap只收录385个呢?用户的什么行为能让google收录更多的网页呢?我决定用其他关键字找到没收录的网页,并且亲自电击它,看看google会不会收录他,待续,等我消息。

继续 交流:tianjin2008.com seo 笔记(二)


1条评论

  1. 同感

发表评论

评论也有版权!

click to change验证码