我要去桂林---田春峰的IT网志

IT改进生活

  DonewsBlog  |  Donews首页  |  Donews社区  |  Donews邮箱  |  我的首页  |  联系作者  |  聚合   |  登录
  135篇文章 :: 2篇收藏:: 104篇评论:: 20个Trackbacks

公告

天天多么乐

田春峰

accesine's Rapleaf Score

关于我的信息链接

Donews Blog

Subscribe with Bloglines

my qq number

文章

收藏

相册

IT精英

存档


正在读取评论……


2005年03月


春天里的Spring(Spring 1.2 rc1 发布了)

 

Spring 1.2 最近发布了. 主要的改进包括以下部分:

 

  • 改变了单个spring.jar的发布情况,支持多个jar包发布。finer-grained distribution jar files, alongside the full spring.jar
  • AOP Alliance 的接口现在包括在spring-aop.和  spring.jar 包中;
  • 增加了对XML bean 定义的改进; ("ref" and "value" shortcut attributes etc)
  • 增强了 AOP TargetSourceCreator 的机制; (supportingLazyInitTargetSource too)
  • 增加了用声明的方式使用事务; annotation 是JDK 1.5的新特性;
  • 增强了 WebLogicJtaTransactionManager (transaction names, isolation levels)
  • 支持JDBC的SqlRowSet(这个特性非常cool);
  • 支持Hibernate3 ;(更新真及时)
  • 支持JMX ,可以导出Spring beans作为可管理的资源可以用MBean访问。
  • 通用属性Commons Attributes and JDK 1.5+ annotations for JMX MBean export

这个发布版本是稳定版推荐在开发中使用。

相关连接:

(田春峰)




这次,我有了yahoo 360 的blog,抢先体验

早上刚得到通知得到邀请了,可是还没有使用体验。

以后写吧

???? ??'s Blog

感觉对中文支持还有问题

另外方便的地方是,可以选择使用使用 simple url

类似下面的格式:类似下面的格式:http://360.yahoo.com/tcf960

最近csdn的blog很不稳定,决定迁移了。

donews 的也不行,看来免费的午餐(.text)不好吃呀!

( From: chedong's blog   :-) )
很高兴和大家共享:但务必附上以下调查表
1 真实姓名:
2 个人简介:
3 到 www.domolo.com 注册;

算是顺便做一下用户调查吧,保证不会将您以上信息公开和用于任何商业用途。白天比较忙,可能晚些时候给大家发来邀请,务必耐心等待。





多么乐发布 自动生成摘要测试版


    多么乐自动摘要简介:
          我们在阅读新闻的时候,选择阅读那条新闻很大程度上是由标题决定的。
          而在我们阅读的时候,很多时候是想有个大概的了解,也就是了解新闻的摘要。
          这就是多么乐自动摘要的出发点。
          下面的连接是测试,希望你能喜欢。
        http://www.domolo.com/domolo/domolosummarize/index.aspx


多么乐主站   新闻超市
贝叶斯论坛垃圾广告屏蔽演示系统  自动生成摘要
CtrlC 源代码搜索引擎 爱吧
小叮咚首页 百家姓,姓名查询
多么乐主论坛  田春峰的Blog 
图片转化为字符 网页速递
  



CtrlC源代码搜索引擎---添加Asp.Net StartKit 系列搜索

CtrlC源代码搜索引擎添加Asp.Net StartKit 系列搜索


    为了便于大家学习 java 和 C# 多么乐 推出了 CtrlC源代码搜索引擎
    现在已经把:jboss,tomcat,hibernate 等经典代码 和下列经典 asp.net 入门代码加了进去,方便大家参考啦。

ASP.NET Commerce (CSSDK) Installer v1.0.msi
ASP.NET Community (CSSDK) Installer v1.0.msi
ASP.NET Portal (CSSDK) Installer v1.0.msi
ASP.NET Reports (CSSDK) Installer v1.0.msi
ASP.NET TimeTracker (CSSDK) Installer v1.0.msi
IssueTrackerCSSDK.msi

 

    为了便于大家学习 java 和 C# 多么乐 推出了 CtrlC源代码搜索引擎
    现在已经把:jboss,tomcat,hibernate 等经典代码 和下列经典 asp.net 入门代码加了进去,方便大家参考啦。

ASP.NET Commerce (CSSDK) Installer v1.0.msi
ASP.NET Community (CSSDK) Installer v1.0.msi
ASP.NET Portal (CSSDK) Installer v1.0.msi
ASP.NET Reports (CSSDK) Installer v1.0.msi
ASP.NET TimeTracker (CSSDK) Installer v1.0.msi
IssueTrackerCSSDK.msi

 





 听到网上介绍新浪推出Blog服务(新浪新动作 )后很想试用一下,可新浪的Blog帐号是“限量发售”。心理太痒痒,只好打到新浪内部,请新浪IASK小组的一位朋友开后门,终于有了一个新浪的Blog,过程破费周折。

     先说说新浪Blog的技术架构,从网页链接看使用的是php技术。
 
http://blog.sina.com.cn/myblog/XXXX.php
 我感觉这是个很成熟的选择。在类似门户网站大用户量的情况下jsp和asp.net似乎还没有特别好的例子。csdn,donews的blog就是一个反面的例子,速度慢不说还经常出现类似““/”应用程序中的服务器错误。”的错误。这两个blog系统使用的.Text Blog后台,希望是.Text架构设计的缺陷而不是.net的过错,否则我这个.net的拥护者可是个打击。
 关于Blog的技术选型,车东也说过类似的问题,他估计也赞同php这样的架构。
 
 我取得激活号码后便开始了体验之旅,感觉新浪继承了iask,vivi等系统的设计经验,尽管不是同一个部门的产品。界面大量使用了类似google的技术,也就是:Ajax: A New Approach to Web Applications .登陆的部分和mywallop的很像。不过我使用过程中弹出了n个javascript脚本错误。
 可能是测试版本的缘故,新浪Blog提供的可定制话的部分不多,这也是我最担心的部分,如果新浪不提供个性定制:css和支持html的个人说明的话,我还是会放弃的。这也是就是我选择csdn blog而不选择
www.cnblogs.com的原因,尽管后者比前者要稳定些。 
 写Blog的Blogger们大多都用自己的服务器,因为怕:集中可怜。我还是喜欢凑热闹,Blog会演变成集市型的还是教堂型的还有待时间验证。
 不管怎么说:可以好好的体验(XP)一下新浪的最新服务了。
 




 CtrlC源代码搜索引擎 是我学习 搜索引擎 的一个试验田,我会把我最新的idea拿出来和大家分享。正如 多么乐 网站建立的初衷一样,有趣的功能是多么乐追求的目标。

 看看我的宣传口号吧:


 文人说:天下文章一大抄,看你会抄不会抄;
 程序员说:天下代码Ctrl+C,Ctrl+V,看你会不会:Ctrl+C;
 我要说:要Ctrl+C,就从CtrlC源代码搜索引擎开始吧。

  目前只支持 java和c# 代码!

 欢迎大家使用,也可以到这里提出建议!

 Just For Fun!

 CtrlC源代码搜索引擎 是我学习 搜索引擎 的一个试验田,我会把我最新的idea拿出来和大家分享。正如 多么乐 网站建立的初衷一样,有趣的功能是多么乐追求的目标。

 看看我的宣传口号吧:


 文人说:天下文章一大抄,看你会抄不会抄;
 程序员说:天下代码Ctrl+C,Ctrl+V,看你会不会:Ctrl+C;
 我要说:要Ctrl+C,就从CtrlC源代码搜索引擎开始吧。

  目前只支持 java和c# 代码!

 欢迎大家使用,也可以到这里提出建议!

 Just For Fun!




网络上关于MapReduce的介绍,最权威的就是 Jeffrey Dean
和 Sanjay Ghemawat 
的那篇:MapReduce: Simpli ed Data Processing on Large Clusters
您可以到 
labs.google.com 上下载。

    对goole这样需要分析处理海量数据的公司来说,普通的编程方法已经不够用了。于是 google开发了MapReduce。简单来说,语法上MapReduce就像Lisp,使用MapReduce模型你可以指定一个Map方法来处理诸如key/value这样的数据,并生成中间形式的 key/value 对,然后再使用 Reduce方法合并所有相同key的中间 key/value 对生成最终结果。google的MapReduce是运行在数千台机器上的处理TB数据的编程工具。

    据说在MapReduce这样的编程模型下,程序可以自动的集群机器中在按照并行方式分布执行。就如同java程序员可以不考虑内存泄露一样,MapReduce程序员也不许要关心海量数据如何被分配到多台机器上,不需要考虑如果参加计算的机器出现故障应该怎么办,不需要考虑这些机器间如何协作共同完成工作的。

    举个例子吧:最近我在做贝叶斯论坛垃圾帖屏蔽演示系统 Beta 1 的时候,就需要计算样本数据中每个词语出现的频率。我的计算步骤就是先分词,然后用hash表处理。要是碰到TB的数据,我的赛扬CPU可是吃不消。那么放在MapReduce下面会是什么样子呢?

    下面是一个伪实现:
第一步:
    map(String key, String value):
    // key: 文档名称
    // value: 文档内容
    for each word w in value:
        EmitIntermediate(w, "1");
第二步:
    reduce(String key, Iterator values):
    // key: 一个词
    // values: 关于这个词的频率数据
    int result = 0;
        for each v in values:
            result += ParseInt(v);
        Emit(AsString(result));
 

    如果你看过向量空间模型就知道,这就是计算 TF 和 IDF 的语义实现。

    Google的WebReduce 包是用C++实现的,在MapReduce: Simpli ed Data Processing on Large Clusters 一文中还包含了一段真实的WebReduce的代码,可以看看,饱饱眼福。




  

介绍:

    作为论坛的版主,肩负的任务之一就是维护论坛发言的质量,删除广告贴,灌水贴 垃圾贴等等.
    本系统的开发目的就是为减轻版主的工作负担,自动识别垃圾贴的一个演示系统
    理论依据是朴素贝叶斯原理.

    使用的过程如下:
    1、首先在多么乐注册帐号,登陆系统。
    2、录入训练系统的原始数据,分两类垃圾贴 和 非垃圾贴。
    3、录入需要检测的帖子,查看帖子是垃圾贴的百分比。

 

 

欢迎一起  讨论 完善这个程序.
 




从搜狐的说吧,谈谈网络公司的创新   

    唯一不变的,就是变化,这是真理。可要对于网络公司而言,变化中还要更加注重:创新。
    我曾写过一篇叫:
网站聚集人气的途径:论坛,贴吧,Iask,Blog 的文章。这不,现在又多了一个途径:搜狐推出了:说吧人物

    在三大门户中间,大部分人都认为觉得搜狐的技术创新能力要差一点,比较一下三大门户提供的服务就可以觉察出来。但是喜欢光着身子上杂志封面的张朝阳却说,搜狐是个技术公司,难免让人不太服气。张朝阳说话要有根据,或许以搜狗为代表的系列产品就是一个佐证吧。在我看来:搜狗站点是搜狐创新的一个试验田,创新成分最多,也完全是基于自有技术团队开发出的一个产品。
    这里我先不谈
说吧 具体如何有特色,如何有创新,单说说网络公司创新的趋势。

    要说创新,不能不提新浪最近推出的一系列新业务。问答式的IAsk , 网络书签vivi 和 姗姗来迟的Blog,以及结合SnS风格的交友社区。难怪业内人士惊呼,新浪最近的创新力度恐怕连网易都自愧不如。

    隐藏在门户网站这一系列动作之后的背景是什么呢?

    盛大收购新浪事件似乎让大家看到了网站的这样一种发展方向:中国互联网未来将从门户时代过渡到服务时代。未来将形成以网络游戏、即时通讯、电子商务及搜索引擎共同支撑的服务“黄金时代”。

    我想门户掌门人,看了上面的话都要倒吸一口冷气。

    我们都知道,现阶段广告是网站收入的主要来源。从这点来讲,门户网站就是要人气,要想法设法吸引人气。人气如何吸引?9000万网民的眼球将会聚焦那里?这都是摆在网络公司面前要迫切回答的问题。物以类聚,人以群分。靠提供单一形式的服务,肯定无法满足所有人的要求。看看这几大门户的最新动作,真有点绞尽脑汁的劲头。   

    keso曾说过网站服务的有用和有趣的问题(再说有趣与有用 ),不知道在这场争先恐后的创新浪潮中,门户网站会演变成什么。   

    下文从技术的角度谈谈门户网站创新的问题。

    (我家的网好像是被封了,从two会开始任何网站都要打开两次才行,而且慢的要命。不过比起早上起来京哈高速的堵车还算好点,一切为了two会。:-) )