我要去桂林---田春峰的IT网志

IT改进生活

  DonewsBlog  |  Donews首页  |  Donews社区  |  Donews邮箱  |  我的首页  |  联系作者  |  聚合   |  登录
  135篇文章 :: 2篇收藏:: 104篇评论:: 20个Trackbacks

公告

天天多么乐

田春峰的IT网志
田春峰


seo 客户端工具下载
Alexa Top 100 索引量研究报告
-->

accesine's Rapleaf Score

关于我的信息链接

Donews Blog

Subscribe with Bloglines

洪洞县杜戍村

文章

收藏

相册

IT精英

存档


正在读取评论……


关于 小叮咚中文分词  .net版本发布的变化

    现在几乎每天都有朋友给我写信,要求交流小叮咚中文分词的实现。我现在实现的有java和C#两个版本。同样的算法逻辑,用 java 和 C#写两边可不是有趣的事情 。于是自然而然想起了 关于lucene发展和多语言实现的方向  中采用的方法,于是决定以后主要更新java版本的中文分词算法,而.net版本的中文分词则在java class基础上转化过来。

    很早的时候我的一篇blog介绍过:基于.NET的Java虚拟机IKVM介绍 。于是今天就尝试了一把,整个过程还算顺利。下面是我的转换过程:

   
    X:\ikvmbin-0.14.0.1\ikvm\bin>ikvmc -target:libraryX:\XXXX\chinese_sentence_splitter.jar
    Note: output file is "chinese_sentence_splitter.dll"
    Note: automatically adding reference to "e:\programming\java&.net\ikvmbin-0.14.0.1\ikvm\bin\ikvm.gnu.classpath.dll"

    通过上面的命令可以把 java jar 文件转换成  同名的 .net dll。

    在java中测试的结果如下:

   

    但在.net中测试的结果却不正确:

   

 

    这很显然是IKVM.NET在转换过程中出现了问题。

    由于第一次使用IKVM.NET,因此这个问题还需要在以后有时间解决一下。也希望有相关经验的朋友多多指导.


    相关连接:

            多么乐
            小叮咚中文分词



Trackback: http://tb.donews.net/TrackBack.aspx?PostId=404590


[点击此处收藏本文]  发表于2005年05月30日 8:38 AM




正在读取评论……

发表评论

大名:
网址:
验证码
评论