2007年04月02日

word可以直接另存为 htm,但即使是 另存为 filtered html 也会有大量的废代码。以前我一般用 dreamweaver 的 clean up html 来处理,先处理 word 特有标签,然后删除一些 font,b,span 等。进一步,在 editpus 里面用正则进行处理,最后得到我想要的干净的html 代码。当然最完美的办法就是拷贝文字出来,自己用文本编辑器书写htm标签。

今天又看到 lifehacker这几种 word 2 clean htm 方法:

1.使用这个HTML Tidy Library Project 开源软件来处理。

2.微软官方站点也有个 Office 2000 HTML Filter 2.0工具,可以用来处理掉 word2000转html时出现的多余代码。这里是简单使用说明。

3.使用这个Word HTML Cleaner 在线工具来处理。只能处理word2000以下版本。

4.有人给出了正则表达式(其实,上面的各种软件也都是用正则来解决的)

删除不需要的标签

<[/]?(font|span|xml|[ovwxp]:\w+)[^>]*?>
- replace any matches with the empty string

删除class,style…等不需要的属性

<([^>]*)(?:class|lang|style|size|face|[ovwxp]:\w+)=(?:’[^']*’|""[^""]*""|[^>]+)([^>]*)>
- replace any matches with <$1$2>

详细解释在Clean Word HTML using Regular Expressions

2006年12月23日

1. 联想“一件恢复”版本以及界面

联想的一键恢复,经历了很多版本,从原来的1.0,到现在的4.6;1.0、2.0和3.0版本没见过,但是从4.0到4.6从功能上没看出有多大区别,只是看到官方的介绍(联想知识库),现在的4.6版本,要求备份空间应该有足够的空间,否则在备份时会提示空间不足。4.0版本到4.5版本都支持从最后一个分区自动划分空间来作为备份空间。4.2版本后在进行一键恢复安装时,可通过标志表示是商用类型还是消费类型,具体办法是在hpatool命令划分分区时,加/sy或/xf参数,商用和消费类型的一键恢复界面不同,如下图:

商用机型一键恢复界面

消费机型一键恢复界面

但是4.6版本的消费类型的一键恢复界面中的菜单有改变,第二个菜单项不叫安装智能维护工具,好像是叫软件与驱动安装。

2. 联想“一件恢复”优缺点

联想的一键恢复有它的好处,主要是体现在方便、安全两个方面。方便表现在:仅需按下一个键再进行简单操作,就可以将瘫痪的计算机恢复到出厂或自己备份的状态,不需要额外的启动和软件介质。安全性体现在,备份分区是隐藏的,一般的软件像常见的分区软件都看不到(这是官方说的,实际上如果安装好系统后或将硬盘分好区后安装一键恢复软件,在没有备份前还是能够看到一键恢复所在的分区,只是一般软件不能对其进行操作)。

现在来说说联想一键恢复的缺点,没有像使用GHOST8.3那样自由,使用GHOST8.3进行备份,系统盘的分区格式和保存备份文件的盘的分区格式没有任何限制,可以是FAT32,也可以是NTFS;并且GHOST8.3的备份文件支持大于2G的文件(当然保存备份的盘的分区格式应该是NTFS);而联想的一键恢复却要求系统盘和最后一个分区都为FAT32格式(联想的说法),实际上NTFS分区也是可以的,但是如果最后一个分区采用NTFS分区格式,那么在备份时自动划分最后一个分区的空间,最后一个分区的原有数据可能被破坏。如果只是这么一个缺点还可以忍受,毕竟一般情况下都是备份完毕后,才在最后一个分区内存放文件,以后如果再需备份,那么把最后一个分区的文件先复制到其他盘即可。最重要的缺点是联想一键恢复的压缩比例,压缩比例太小,而且不可选择,不想GHOST8那样可以选择Normal、Fast、High,联想的一键恢复就是一种压缩方式,压缩比例有点像GHOST8的NORMAL方式。我做了测试,以下是测试数据对比:

C盘已使用空间:15.32G(装了较多的软件,都装在C盘,C盘总空间为20G)

GHOST8.3:

备份时长           25分钟
备份文件大小    7.99G
恢复时长           14分钟

联想一键恢复:

备份时长           25分钟
备份文件大小    13.6G(我在进行一键恢复安装时使用的参数是/0201 10M  /1002 100M,只装了一键恢复)
恢复时长            由于备份文件占据空间太多了,因此没测试(个人估计恢复时间应该在20-30分钟)

联想一键恢复在备份系统盘时,花费时间和GHOST8差不多,但是磁盘空间却多了将近一倍。因此使用联想的一键恢复适合只备份操作系统和较少的软件,不适合大量软件安装后的备份,或者将大部分软件安装在D盘,这样C盘所占的空间就少了,但是把软件安装在D盘,又对安全性带来了一定影响,因为D盘上的软件有可能感染病毒,如果真是这样,即便是恢复了系统盘,大部分软件还要重装(不过如过能将病毒清除干净,则无需重装)。

联想的一键恢复,真是鸡肋,“食之无味、弃之可惜”,希望联想的开发人员改进一键恢复软件核心,提高要缩比例。

3. 联想“一件恢复”的安装

网上可以查到很多如何安装联想“一键恢复”的文章,关于联想“一键恢复”安装,官方的要求是要求硬盘是一张无数据的空盘,最好还没有进行分区,先安装一键恢复,再进行分区和系统的安装。实际上,硬盘有没有分区甚至是有没有安装系统,对联想“一键恢复”的安装都没有影响。

在已经安装Windows XP的情况下,将最后一个分区删除分区格式,然后安装联想“一键恢复”,安装完成后,再使用分区软件把剩余的空间创建分区,然后就可以使用“一键恢复”进行备份和还原了(联想官方的要求是创建备份后,硬盘的分区信息不能改变)。这种已经安装完操作系统的方法,只要保证最后一个分区不要存放文件,另外最后一个分区有足够的空间供备份使用即可,无所谓何种分区格式,可以是FAT32,也可以是NTFS(因为官方强烈建议你把第一个分区和最后一个分区建成FAT32格式,因此如果是NTFS,联想不保证可靠性)。

当然可能没有安装操作系统,但是由于硬盘中有数据,不想破坏掉,则也是只要把最后一个分区按照上面的方法进行操作,然后安装操作系统和软件,然后再备份。

如果你的硬盘连区也没分,那太好了,先安装“一键恢复”,再进行分区,这时候没备份前“一键恢复”核心等所占用的空间也看不到(上面两种方法,在进行备份前,这部分空间是看得到的,只是你对他不能进行任何操作,及其变态的办法除外)。分区完后,安装系统和软件,进行备份。

至于不同版本“一键恢复”的安装方法,只要你下载到了联想的“一键恢复”软件,一般里面都有简单说明,照着里面的会说明,安装就行了。

安装比较简单的是“一键恢复”4.0,只要执行三个可执行文件即可完成默认配置。4.1版本以后都是要执行2个可执行文件,但是在进行隐含分区配置时,有TypeID参数,比较麻烦,没有TypeID参数的说明,其实你安装完成后,使用HPATOOL查看HPA分区信息,也大致能够猜到相应TypeID的区是备份什么的区。比如/0201是“一键恢复”核心所在的区,一般是20M。

4. 关于LEOS操作系统

另外还有LEOS操作系统(联想开发的嵌入式操作系统,据说是Linux的微内核),在测试时,安装成功,但是不知如何进入。因为我的计算机没有相应的快捷键。

2006年12月22日

一直使用金山词霸产品,最早使用的是金山词霸2000,后来使用金山词霸2005,今年的2007可以免费试用,因此也下载试用了一下,为了进行对比,也找了个金山词霸2003医学版和金山词霸2006看了一下。

金山词霸2000由于过了很长时间,因此没有印象了。从词典收录来看,金山词霸2003医学版和金山词霸2005应该是最全的。

应该说,金山词霸从2003到2005有比较大的变化,首先是词典文件格式发生了变化,自然词典管理模块也发生了变化;另外金山词霸2005 去掉了四本词典:“英中医学辞海”、“汉英石油大词典”、“新英汉石油技术词典”和“英汉石油大词典”,但是增加了“洋话连篇”视频词库(没有太大的意义)。另外在词典提供的附录方面进行了一些调整,去掉了一些不实用的附录。

金山词霸2005和金山词霸2006相比较变化不是太大,金山词霸2006最大的改变是在防盗版方面做了一些工作,搞了个金山通行证,不再使用序列号;词典文件格式没有变化,改进了词典管理模块和取词模块;金山词霸2006删减了一些词典,从原来的200多本删减到150多本,完善升级了一些词典,并且去掉了意义不大的“洋话连篇”,但是金山词霸2006增加了汉日互译辞典;金山词霸2006还增加了在线升级,尽管很多用户抱怨金山公司从来没有提供过什么在线升级;另外金山词霸2006在主界面中还增加了网站主页以及手机订阅链接(这部分的网页在今年已经打不开了)。实际上金山词霸2005和金山词霸2006是可以通用的,因此可以把金山词霸2006看作金山词霸2005的升级版本,毕竟金山词霸2006推出的时间仅在金山词霸2005一年零2个月之后。金山公司推金山词霸2006的卖点应该是汉日互译。

金山词霸2007和金山词霸2006相比有较大的变化。金山词霸2007的卖点应该是短句查询,但实际上短句查询必须能够上网才可以进行(实际上网络短句查询本来就是免费的,你不购买金山词霸2007也可以使用金山的网络查询功能);金山词霸2007还充分作了一些网络订阅学习的广告,这部分都是收费的,还有通过收集订阅学习的部分,毕竟现在通过手机学习英语已经作为手机的一个附加功能在不断加强,因此意义不是太大。金山词霸2007的词典文件格式和金山词霸2006比没有变化,但是改变了词典管理模块以及取词模块;从收录的词典数量上来讲,没有变化,有些用户抱怨说把金山词霸2006的汉日、日汉词典换成简明版的,实际上,金山词霸2007收录的汉日、日汉词典及有新的简明版,又有金山词霸2006的版本,只不过是金山词霸2007默认使用简明版本的汉日、日汉词典(如果想使用金山词霸2006的汉日、日汉词典版本,只要适当修改dict.xml文件即可,把文件中的简明汉日、日汉词典文件名换成原来的文件名即可),另外金山词霸2007还完善和升级了一些词典;金山词霸2007提供了一些金山词霸2006没有的但是不太实用的词霸例句,不太多犹如鸡肋;金山词霸2007改变了附录的文件格式,由原来的dic文件改成了mht文件;金山词霸2007去掉了全文检索功能(搞不清楚为何?),另外还对附录的内容进行了一些调整,更搞不懂的是竟然去掉了拼音、部首检字表。有网站介绍金山词霸2007作占用的内存空间比较较小,我作过对比,金山词霸2006启动后占用的内存空间的确比较大,在22M左右,金山词霸2005也占用14M左右,金山词霸2007占用4M左右,但实际上金山词霸2006以及2005启动后你将界面最小化后在最大化,你会发现占用的空间也会减少到5M左右,关于这方面,还有网友作过更为详细的对比,说金山词霸2007没有准确的再进程列表中显示自己所占用的内存空间,也就是说金山词霸2007时己所占用的内存空间要比在进程列表中显示的大。但是不管怎么说,金山词霸2007在进程结束方面作了很大改进,原来的金山词霸2005以及2006,如果是通过菜单退出,进程要过几秒钟才能杀死,但是金山词霸2007却没有这个问题。

这几天我也对金山词霸2005以后的词典文件格式进行了分析,想把金山词霸2003医学版的“英中医学辞海”一直到金山词霸2005使用,但是只是分析出了一部分头文件的含义,因此没有成功,网上也没有人提供一些参考的信息。

综合来说,除去金山词霸2005的取词模块在XP下会出现闪屏问题外,金山词霸2005还是一个不错的金山词霸版本,其实如果你使用金山词霸2006或2007版本的取词模块文件,这个问题自然就会解决。

2006年12月19日

将以下代码复制,保存为htm文件即可。

 

<title>
中文<->Unicode转换器</title>
<body>
<textarea cols=100 rows=20 id=code>
</textarea>
<input type=button onclick=encode(code,this) value=" 编码 ">
<br><br>输入要转换的字符,然后按“编码”按钮即可将输入内容转换成可供Java调用的Unicode编码。<br> 按“解码”按钮可转换回原来的字符。<br><br></body>
<script>
var mode=" 编码 ";
function encode(obj,btn){
  if(mode==" 编码 "){
                obj.value=obj.value.replace(/[^\u0000-\u00FF]/g,function($0){return escape($0).replace(/(%u)(\w{4})/gi,"\\u$2")});
                btn.value=" 解码 ";
   mode=" 解码 ";
        }else{
obj.value=unescape(obj.value.replace(/\\u/g,’%u’));
                btn.value=" 编码 ";
               mode=" 编码 ";
        }
}
</script> 

 

2006年12月15日

        虽然使用GHOST备份还原系统很方便,但是GHOST毕竟对硬盘还是有损害的。如果不是系统瘫痪,或中毒很深,选择XP的系统还原还是很不错的。

一. 根据需要打开或关闭系统还原,调节系统还原所占用磁盘空间

       默认状态下,Windows XP对所有分区都启用系统还原功能的,系统还原是以占用硬盘空间为基础的,因此我们可以根据自己需要进行系统还原的打开或关闭,并对还原所占用的磁盘空间进行调整,方法如下:
1. 右击桌面上“我的电脑”图标,单击“属性”菜单按钮,打开调出“系统属性”窗口;点击“系统还原”标签(如图1),当然也可通过按键盘上的“Windows徽标+Pause/Break”组合键打开“系统属性”窗口。

图1

2. 在“可用的驱动器”选中分区,点击“设置”按钮; 在弹出的设置窗口中,勾选“关闭这个驱动器上的“系统还原”(T)”复选框,此时则关闭此磁盘分区的自动还原(如图2);去掉勾选,则打开此磁盘分区的自动还原,你可以调整系统还原所占用的磁盘空间(磁盘分区容量的百分比)(如图3);

图2

图3

3. 上面的方法(即2)是针对非系统分区,对于系统分区,如果想调整还原所占用空间大小,也是单击图1中的“设置”按钮,在弹出的对话框中进行空间的调整,如图4所示。

图4

       在系统盘的设置窗口中,不包括关闭或打开系统还原的按钮选项,因此如果想关闭系统盘的系统还原,必须在图1的窗口中勾选“关闭所有驱动器的系统还原”即可。如果关闭后再想打开系统盘的系统还原,则在图1所示的窗口中去掉“关闭所有驱动器的系统还原”即可打开所有驱动器的系统还原,包括系统盘。 

二. 更改系统还原自动备份还原点周期
       在默认状态下,Windows XP将以每使用系统时间达到24小时就自动备份一个还原点,如果觉得这个周期太长或太短,我们可以进行修改。方法如下:
1. 打开注册表编辑器;在左侧目录树中依次展开主键[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion\SystemRestore],双击右面板一名为“RPGlobalInterval”的DWORD值(如图5,如无此键值,新建即可),弹出修改键值对话框,在文本框中输入周期时间,这里的时间是以秒为单位的,如默认的24小时就可以输入“86400”(即60×60×24得到,注意在十六进制下请输入15180),可根据需要对这个时间间隔数据进行修改;
2. 关闭注册表,重启Windows XP即可生效。

图5

三. 事先设置不要还原的文件(夹),以保护重要文件
       我们仅希望系统还原的尽量是系统文件,如果在系统分区中有重要数据,且未在“我的文档”中,那么我们还得将这些文件(夹)添加到保护列表中。具体方法如下:
1. 打开注册表编辑器;在左侧目录树中依次展开主键[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\BackupRestore\FilesNotToBackup],此时右窗口已经有相关键值项,添加自定义文件(夹)方法也非常简单,单击右键,选择“新建→多字符串值”,然后在键值项名称中随便输入能够能够标识备份文件夹,两次回车后,弹出修改键值对话框,在文本框中输入需要保护文件(夹)的绝对路径;(如图6)
2. 关闭注册表,重启Windows XP后,使用系统还原功能将不对这些受保护的文件(夹)覆盖。

图6

四. 根据需要,自己创建还原点
       最重要的是,除了系统创建还原点外,还可以自己根据需要创建还原点,这样就可以更有针对性地进行还原了。具体方法如下:
1. 依次点击“开始→所有程序→附件→系统工具→系统还原”,打开“系统还原”窗口,如图7所示。

图7

2. 选择“创建一个还原点”,单击“下一步”,打开“创建一个还原点”窗口,在还原点描述处输入自己想要的信息,单击“创建”,稍等片刻即可完成;如图8所示:

图8

五. 根据需要进行还原
    使用系统还原有以下两种途径。
1. 第一种直接通过系统还原工具还原

在图6所示的窗口中选择“恢复我的计算机到一个较早的时间(R)”选项,点击“下一步”,就会出现如图9所示的系统还原窗口。

图9

       在窗口的左侧,选择要还原的日期,在窗口的右侧会出现那一天的还原列表中(如果有的话),“单击一个还原点”的“<”和“>”按钮切换还原点,然后单击“下一步”,在一些警告信息后继续“下一步”确认还原。

2. 在安全模式下还原

计算机启动时进入安全模式,登录系统后会有一个是否工作在安全模式(否则进行还原)的提示,如果选No,则会出现如图8所示的窗口,按照提示单击下一步即可实现还原。

2006年12月11日

搬家于CDD个人主页

 现在下载软件常用的软件是迅雷,迅雷的好处可以自动搜索资源,并且是多线程下载,但是迅雷软件有一个广告条,能够自动连接到迅雷网站的广告服务器,从而实现动态广告,非常烦人,特别是有一段时间的“蚂蚁”广告,简直令人恶心。

至于广告条的处理方法有多种,一种是下载无广告的绿色版本;我这里介绍的方法没有去掉广告条,但是可以让广告固定为迅雷默认的广告,不再动态变化,如下图所示。

方法一:

找到迅雷所在文件夹,里面有一个program文件夹,找到gui.cfg文件,用记事本(或者其他编辑器)打开,将里面的“ADServer=http://biz4.sandai.net/bd/thunder5/show/adtask.xml”改为:“ADServer=ad\default_main.swf”,保存即可。

方法二:

找到迅雷所在文件夹,里面有一个program文件夹,找到adtask.xml文件,用记事本打开,将文件里面的内容全部删除,然后保存关闭,再将此文件改为只读属性即可。

2006年12月2日

搬家于CDD个人主页