2006年03月23日

前两天在和讯上发表文章,很令人奇怪的事情,日文可以发表,韩文就不行了,怪怪的~~
到底是与什么有关系呢?和讯的数据库?操作系统?IE?or others……
操作系统是英文版2003,区域默认语言是日文,IE优先语言中文,哈哈乱套了~
刚好看到一篇关于unicode的文章,嗯~~ 看看吧,也许会有些收获。

———————————————————————————————

Unicode是一种字符编码规范 。

先从ASCII说起。ASCII是用来表示英文字符的一种编码规范,每个ASCII字符占用1个字节(8bits)
因此,ASCII编码可以表示的最大字符数是256,其实英文字符并没有那么多,一般只用前128个(最高位为0),其中包括了控制字符、数字、大小写字母和其他一些符号 。
而最高位为1的另128个字符被成为“扩展ASCII”,一般用来存放英文的制表符、部分音标字符等等的一些其他符号
这种字符编码规范显然用来处理英文没有什么问题 。(实际上也可以用来处理法文、德文等一些其他的西欧字符,但是不能和英文通用),但是面对中文、阿拉伯文之类复杂的文字,255个字符显然不够用,于是,各个国家纷纷制定了自己的文字编码规范,其中中文的文字编码规范叫做“GB2312-80”,它是和ASCII兼容的一种编码规范,其实就是利用扩展ASCII没有真正标准化这一点,把一个中文字符用两个扩展ASCII字符来表示。

       但是这个方法有问题,最大的问题就是,中文文字没有真正属于自己的编码,因为扩展ASCII码虽然没有真正的标准化,但是PC里的ASCII码还是有一个事实标准的(存放着英文制表符),所以很多软件利用这些符号来画表格。这样的软件用到中文系统中,这些表格符就会被误认作中文字,破坏版面。而且,统计中英文混合字符串中的字数,也是比较复杂的,我们必须判断一个ASCII码是否扩展,以及它的下一个ASCII是否扩展,然后才“猜”那可能是一个中文字 。 

       总之当时处理中文是很痛苦的。而更痛苦的是GB2312是国家标准,台湾当时有一个Big5编码标准,很多编码和GB是相同的,所以……,嘿嘿。

       这时候,我们就知道,要真正解决中文问题,不能从扩展ASCII的角度入手,也不能仅靠中国一家来解决。而必须有一个全新的编码系统,这个系统要可以将中文、英文、法文、德文……等等所有的文字统一起来考虑,为每个文字都分配一个单独的编码,这样才不会有上面那种现象出现。

       于是,Unicode诞生了。

       Unicode有两套标准,一套叫UCS-2(Unicode-16),用2个字节为字符编码,另一套叫UCS-4(Unicode-32),用4个字节为字符编码。

       以目前常用的UCS-2为例,它可以表示的字符数为2^16=65535,基本上可以容纳所有的欧美字符和绝大部分的亚洲字符 。

        UTF-8的问题后面会提到 。

      在Unicode里,所有的字符被一视同仁。汉字不再使用“两个扩展ASCII”,而是使用“1个Unicode”,注意,现在的汉字是“一个字符”了,于是,拆字、统计字数这些问题也就自然而然的解决了 。

       但是,这个世界不是理想的,不可能在一夜之间所有的系统都使用Unicode来处理字符,所以Unicode在诞生之日,就必须考虑一个严峻的问题:和ASCII字符集之间的不兼容问题。

      我们知道,ASCII字符是单个字节的,比如“A”的ASCII是65。而Unicode是双字节的,比如“A”的Unicode是0065,这就造成了一个非常大的问题:以前处理ASCII的那套机制不能被用来处理Unicode了 。

      另一个更加严重的问题是,C语言使用’\0′作为字符串结尾,而Unicode里恰恰有很多字符都有一个字节为0,这样一来,C语言的字符串函数将无法正常处理Unicode,除非把世界上所有用C写的程序以及他们所用的函数库全部换掉 。

      于是,比Unicode更伟大的东东诞生了,之所以说它更伟大是因为它让Unicode不再存在于纸上,而是真实的存在于我们大家的电脑中。那就是:UTF 。

      UTF= UCS Transformation Format UCS转换格式

      它是将Unicode编码规则和计算机的实际编码对应起来的一个规则。现在流行的UTF有2种:UTF-8和UTF-16 。

       其中UTF-16和上面提到的Unicode本身的编码规范是一致的,这里不多说了。而UTF-8不同,它定义了一种“区间规则”,这种规则可以和ASCII编码保持最大程度的兼容 。

      UTF-8有点类似于Haffman编码,它将Unicode编码为00000000-0000007F的字符,用单个字节来表示;

      00000080-000007FF的字符用两个字节表示

      00000800-0000FFFF的字符用3字节表示

      因为目前为止Unicode-16规范没有指定FFFF以上的字符,所以UTF-8最多是使用3个字节来表示一个字符。但理论上来说,UTF-8最多需要用6字节表示一个字符。

      在UTF-8里,英文字符仍然跟ASCII编码一样,因此原先的函数库可以继续使用。而中文的编码范围是在0080-07FF之间,因此是2个字节表示(但这两个字节和GB编码的两个字节是不同的),用专门的Unicode处理类可以对UTF编码进行处理。

      下面说说中文的问题。

由于历史的原因,在Unicode之前,一共存在过3套中文编码标准。

GB2312-80,是中国大陆使用的国家标准,其中一共编码了6763个常用简体汉字。Big5,是台湾使用的编码标准,编码了台湾使用的繁体汉字,大概有8千多个。HKSCS,是中国香港使用的编码标准,字体也是繁体,但跟Big5有所不同。

这3套编码标准都采用了两个扩展ASCII的方法,因此,几套编码互不兼容,而且编码区间也各有不同

因为其不兼容性,在同一个系统中同时显示GB和Big5基本上是不可能的。当时的南极星、RichWin等等软件,在自动识别中文编码、自动显示正确编码方面都做了很多努力 。

他们用了怎样的技术我就不得而知了,我知道好像南极星曾经以同屏显示繁简中文为卖点。

后来,由于各方面的原因,国际上又制定了针对中文的统一字符集GBK和GB18030,其中GBK已经在Windows、Linux等多种操作系统中被实现。

GBK兼容GB2312,并增加了大量不常用汉字,还加入了几乎所有的Big5中的繁体汉字。但是GBK中的繁体汉字和Big5中的几乎不兼容。

GB18030相当于是GBK的超集,比GBK包含的字符更多。据我所知目前还没有操作系统直接支持GB18030。

谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词
这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念,增进知识,类似于打RPG游戏的升级。整理这篇文章的动机是两个问题:

问题一:
使用Windows记事本的“另存为”,可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件,Windows是怎样识别编码方式的呢?

我很早前就发现Unicode、Unicode big endian和UTF-8编码的txt文件的开头会多出几个字节,分别是FF、FE(Unicode),FE、FF(Unicode big endian),EF、BB、BF(UTF-8)。但这些标记是基于什么标准呢?

问题二:
最近在网上看到一个ConvertUTF.c,实现了UTF-32、UTF-16和UTF-8这三种编码方式的相互转换。对于Unicode(UCS2)、GBK、UTF-8这些编码方式,我原来就了解。但这个程序让我有些糊涂,想不起来UTF-16和UCS2有什么关系。
查了查相关资料,总算将这些问题弄清楚了,顺带也了解了一些Unicode的细节。写成一篇文章,送给有过类似疑问的朋友。本文在写作时尽量做到通俗易懂,但要求读者知道什么是字节,什么是十六进制。

0、big endian和little endian
big endian和little endian是CPU处理多字节数的不同方式。例如“汉”字的Unicode编码是6C49。那么写到文件里时,究竟是将6C写在前面,还是将49写在前面?如果将6C写在前面,就是big endian。还是将49写在前面,就是little endian。

“endian”这个词出自《格列佛游记》。小人国的内战就源于吃鸡蛋时是究竟从大头(Big-Endian)敲开还是从小头(Little-Endian)敲开,由此曾发生过六次叛乱,其中一个皇帝送了命,另一个丢了王位。

我们一般将endian翻译成“字节序”,将big endian和little endian称作“大尾”和“小尾”。

1、字符编码、内码,顺带介绍汉字编码
字符必须编码后才能被计算机处理。计算机使用的缺省编码方式就是计算机的内码。早期的计算机使用7位的ASCII编码,为了处理汉字,程序员设计了用于简体中文的GB2312和用于繁体中文的big5。

GB2312(1980年)一共收录了7445个字符,包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0-F7,低字节从A1-FE,占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE。

GB2312支持的汉字太少。1995年的汉字扩展规范GBK1.0收录了21886个符号,它分为汉字区和图形符号区。汉字区包括21003个字符。2000年的GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。现在的PC平台必须支持GB18030,对嵌入式产品暂不作要求。所以手机、MP3一般只支持GB2312。

从ASCII、GB2312、GBK到GB18030,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在这些编码中,英文和中文可以统一地处理。区分中文编码的方法是高字节的最高位不为0。按照程序员的称呼,GB2312、GBK到GB18030都属于双字节字符集 (DBCS)。

有的中文Windows的缺省内码还是GBK,可以通过GB18030升级包升级到GB18030。不过GB18030相对GBK增加的字符,普通人是很难用到的,通常我们还是用GBK指代中文Windows内码。

这里还有一些细节:

GB2312的原文还是区位码,从区位码到内码,需要在高字节和低字节上分别加上A0。

在DBCS中,GB内码的存储格式始终是big endian,即高位在前。

GB2312的两个字节的最高位都是1。但符合这个条件的码位只有128*128=16384个。所以GBK和GB18030的低字节最高位都可能不是1。不过这不影响DBCS字符流的解析:在读取DBCS字符流时,只要遇到高位为1的字节,就可以将下两个字节作为一个双字节编码,而不用管低字节的高位是什么。

2、Unicode、UCS和UTF
前面提到从ASCII、GB2312、GBK到GB18030的编码方法是向下兼容的。而Unicode只与ASCII兼容(更准确地说,是与ISO-8859-1兼容),与GB码不兼容。例如“汉”字的Unicode编码是6C49,而GB码是BABA。

Unicode也是一种字符编码方法,不过它是由国际组织设计,可以容纳全世界所有语言文字的编码方案。Unicode的学名是"Universal Multiple-Octet Coded Character Set",简称为UCS。UCS可以看作是"Unicode Character Set"的缩写。

根据维基百科全书(http://zh.wikipedia.org/wiki/)的记载:历史上存在两个试图独立设计Unicode的组织,即国际标准化组织(ISO)和一个软件制造商的协会(unicode.org)。ISO开发了ISO 10646项目,Unicode协会开发了Unicode项目。

在1991年前后,双方都认识到世界不需要两个不兼容的字符集。于是它们开始合并双方的工作成果,并为创立一个单一编码表而协同工作。从Unicode2.0开始,Unicode项目采用了与ISO 10646-1相同的字库和字码。

目前两个项目仍都存在,并独立地公布各自的标准。Unicode协会现在的最新版本是2005年的Unicode 4.1.0。ISO的最新标准是10646-3:2003。

UCS规定了怎么用多个字节表示各种文字。怎样传输这些编码,是由UTF(UCS Transformation Format)规范规定的,常见的UTF规范包括UTF-8、UTF-7、UTF-16。

IETF的RFC2781和RFC3629以RFC的一贯风格,清晰、明快又不失严谨地描述了UTF-16和UTF-8的编码方法。我总是记不得IETF是Internet Engineering Task Force的缩写。但IETF负责维护的RFC是Internet上一切规范的基础。

3、UCS-2、UCS-4、BMP

UCS有两种格式:UCS-2和UCS-4。顾名思义,UCS-2就是用两个字节编码,UCS-4就是用4个字节(实际上只用了31位,最高位必须为0)编码。下面让我们做一些简单的数学游戏:

UCS-2有2^16=65536个码位,UCS-4有2^31=2147483648个码位。

UCS-4根据最高位为0的最高字节分成2^7=128个group。每个group再根据次高字节分为256个plane。每个plane根据第3个字节分为256行 (rows),每行包含256个cells。当然同一行的cells只是最后一个字节不同,其余都相同。

group 0的plane 0被称作Basic Multilingual Plane, 即BMP。或者说UCS-4中,高两个字节为0的码位被称作BMP。

将UCS-4的BMP去掉前面的两个零字节就得到了UCS-2。在UCS-2的两个字节前加上两个零字节,就得到了UCS-4的BMP。而目前的UCS-4规范中还没有任何字符被分配在BMP之外。

4、UTF编码

UTF-8就是以8位为单元对UCS进行编码。从UCS-2到UTF-8的编码方式如下:

UCS-2编码(16进制) UTF-8 字节流(二进制)
0000 – 007F 0xxxxxxx
0080 – 07FF 110xxxxx 10xxxxxx
0800 – FFFF 1110xxxx 10xxxxxx 10xxxxxx

例如“汉”字的Unicode编码是6C49。6C49在0800-FFFF之间,所以肯定要用3字节模板了:1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是:0110 110001 001001, 用这个比特流依次代替模板中的x,得到:11100110 10110001 10001001,即E6 B1 89。

读者可以用记事本测试一下我们的编码是否正确。

UTF-16以16位为单元对UCS进行编码。对于小于0×10000的UCS码,UTF-16编码就等于UCS码对应的16位无符号整数。对于不小于0×10000的UCS码,定义了一个算法。不过由于实际使用的UCS2,或者UCS4的BMP必然小于0×10000,所以就目前而言,可以认为UTF-16和UCS-2基本相同。但UCS-2只是一个编码方案,UTF-16却要用于实际的传输,所以就不得不考虑字节序的问题。

5、UTF的字节序和BOM
UTF-8以字节为编码单元,没有字节序的问题。UTF-16以两个字节为编码单元,在解释一个UTF-16文本前,首先要弄清楚每个编码单元的字节序。例如收到一个“奎”的Unicode编码是594E,“乙”的Unicode编码是4E59。如果我们收到UTF-16字节流“594E”,那么这是“奎”还是“乙”?

Unicode规范中推荐的标记字节顺序的方法是BOM。BOM不是“Bill Of Material”的BOM表,而是Byte Order Mark。BOM是一个有点小聪明的想法:

在UCS编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的编码是FEFF。而FFFE在UCS中是不存在的字符,所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前,先传输字符"ZERO WIDTH NO-BREAK SPACE"。

这样如果接收者收到FEFF,就表明这个字节流是Big-Endian的;如果收到FFFE,就表明这个字节流是Little-Endian的。因此字符"ZERO WIDTH NO-BREAK SPACE"又被称作BOM。

UTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是EF BB BF(读者可以用我们前面介绍的编码方法验证一下)。所以如果接收者收到以EF BB BF开头的字节流,就知道这是UTF-8编码了。

Windows就是使用BOM来标记文本文件的编码方式的。

6、进一步的参考资料
本文主要参考的资料是 "Short overview of ISO-IEC 10646 and Unicode" (http://www.nada.kth.se/i18n/ucs/unicode-iso10646-oview.html)。

我还找了两篇看上去不错的资料,不过因为我开始的疑问都找到了答案,所以就没有看:

"Understanding Unicode A general introduction to the Unicode Standard" (http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&item_id=IWS-Chapter04a)
"Character set encoding basics Understanding character set encodings and legacy encodings" (http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&item_id=IWS-Chapter03)    
2006年02月24日

net use \\ip\ipc$ ” ” /user:” ” 建立IPC空链接
net use \\ip\ipc$ “密码” /user:”用户名” 建立IPC非空链接
net use h: \\ip\c$ “密码” /user:”用户名” 直接登陆后映射对方C:到本地为H:
net use h: \\ip\c$ 登陆后映射对方C:到本地为H:
net use \\ip\ipc$ /del 删除IPC链接
net use h: /del 删除映射对方到本地的为H:的映射
net user 用户名 密码 /add 建立用户
net user guest /active:yes 激活guest用户
net user 查看有哪些用户
net user 帐户名 查看帐户的属性
net localgroup ***istrators 用户名 /add 把“用户”添加到管理员中使其具有管理员权限,注意:***istrator后加s用复数
net start 查看开启了哪些服务
net start 服务名  开启服务;(如:net start telnet, net start schedule)
net stop 服务名 停止某服务
net time \\目标ip 查看对方时间
net time \\目标ip /set 设置本地计算机时间与“目标IP”主机的时间同步,加上参数/yes可取消确认信息
net view 查看本地局域网内开启了哪些共享
net view \\ip 查看对方局域网内开启了哪些共享
net config 显示系统网络设置
net logoff 断开连接的共享
net pause 服务名 暂停某服务
net send ip “文本信息” 向对方发信息
net ver 局域网内正在使用的网络连接类型和信息
net share 查看本地开启的共享
net share ipc$ 开启ipc$共享
net share ipc$ /del 删除ipc$共享
net share c$ /del 删除C:共享
net user guest 12345 用guest用户登陆后用将密码改为12345
net password 密码 更改系统登陆密码
netstat -a 查看开启了哪些端口,常用netstat -an
netstat -n 查看端口的网络连接情况,常用netstat -an
netstat -v 查看正在进行的工作
netstat -p 协议名 例:netstat -p tcq/ip 查看某协议使用情况(查看tcp/ip协议使用情况)
netstat -s 查看正在使用的所有协议使用情况
nbtstat -A ip 对方136到139其中一个端口开了的话,就可查看对方最近登陆的用户名(03前的为用户名)-注意:参数-A要大写
tracert -参数 ip(或计算机名) 跟踪路由(数据包),参数:“-w数字”用于设置超时间隔。
ping ip(或域名) 向对方主机发送默认大小为32字节的数据,参数:“-l[空格]数据包大小”;“-n发送数据次数”;“-t”指一直ping。
ping -t -l 65550 ip 死亡之ping(发送大于64K的文件并一直ping就成了死亡之ping)
ipconfig (winipcfg) 用于windows NT及XP(windows 95 98)查看本地ip地址,ipconfig可用参数“/all”显示全部配置信息
tlist -t 以树行列表显示进程(为系统的附加工具,默认是没有安装的,在安装目录的Support/tools文件夹内)
kill -F 进程名 加-F参数后强制结束某进程(为系统的附加工具,默认是没有安装的,在安装目录的Support/tools文件夹内)
del -F 文件名 加-F参数后就可删除只读文件,/AR、/AH、/AS、/AA分别表示删除只读、隐藏、系统、存档文件,/A-R、/A-H、/A-S、/A-A表示删除除只读、隐藏、系统、存档以外的文件。例如“DEL/AR *.*”表示删除当前目录下所有只读文件,“DEL/A-S *.*”表示删除当前目录下除系统文件以外的所有文件

2006年02月18日

    在全球“10年来对IT业影响最大的10个人”排行榜上,英国人蒂姆·伯纳斯·李(Tim Berners-Lee)位居第一。伯纳斯-李是谁,他对IT业究竟作出了什么样的贡献?竟然能让全球首富盖茨屈居第二?

不说不知道,一说准吓你一跳,伯纳斯·李就是“WWW”(World Wide Web)的发明人。

伯纳斯·李出生于伦敦的一个科学世家,他的父母都是计算机领域的先驱。小时候,受家庭影响,伯纳斯·李与电脑结下了不解之缘,渐渐显露出超群的才华。

1976年,21岁的伯纳斯·李获得了牛津大学物理学的学士学位,实现了他的梦想──进入英国某高技术公司,研究集成电路和系统设计。在这家公司,伯纳斯·李埋头苦干了8年。1984年,他以扎实的理论基础,天资聪颖的悟性,赢得了欧洲粒子物理研究所一个软件工程师的职位。

那一年,伯纳斯·李来到瑞士日内瓦,走进了欧洲粒子物理研究所──即欧洲核能研究中心。这是一个精英荟萃之地,也是科学家大显身手的用武之地,伯纳斯·李在这里如鱼得水,他的聪明才智得到了超常的发挥。

世界上的许多发明创造往往都有某种偶然性,1989年,为了设计一个供同事们交换资料的线上工作空间,伯纳斯·李提出了一个称之为“World Wide Web”的全球超文本项目计划,目的是能够将各自的信息通过超文本传输实现网络共享。一年以后,伯纳斯·李开发出架构起全球信息网的三大基本技术:http(超文件传输协议──电脑与服务器之间的沟通语言)、html(超文字描述語言──全球通用的文件格式),以及URL(网址──文件位置的标示系统)。

1991年的新年刚过,伯纳斯·李便把自己开发的全球信息网放到互联网上。于是,一个划时代的奇迹,在欧洲粒子物理研究所、在伯纳斯·李的手中诞生了──这就是今天风靡世界的WWW。

“WWW”一上网,便如风一样迅速传遍全世界。我们很难找到一个更合适的词汇,来形容人们对“WWW”的欢迎和喜爱。互联网对于人类文明的贡献,丝毫不亚于印刷术的发明,伯纳斯·李因此红遍全球,人们称他为“互联网之父”,他的历史地位足以与发明陶活字印刷术的毕升相提并论。

伯纳斯·李的这项发明,加速了信息革命的步伐,推动了知识经济的进程。从互联网诞生的那一天起,至今也才十多年时间,我们想想看,这十多年世界发生了多么大的变化,而关于信息时代的大多数突出的成就,莫不与互联网有关。

互联网改变了世界经济的游戏规则,把百万富翁、千万富翁乃至亿万富翁的成长期,缩短到了令人无法想象的“超高速”。没有互联网,就没有钱伯斯、没有杨致远……也没有数以亿计的网民。进一步说,没有伯纳斯·李,互联网至少要推迟几年甚至十几年才有可能普及。

然而,年过半百的伯纳斯·李,既没成为大富翁,也没有成为大红大紫的媒体宠儿,他仍然默默无闻地坐在研究室里,从事新项目的开发。

1994年,伯纳斯·李来到了美国,加入麻省理工学院计算机科学实验室,并就任非营利机构“全球互联网联盟”(World Wide Web Consortium──简称“W3C”)组织的执行主席。这是一个非营利性组织,其成员包括微软、网景、Sun、苹果与IBM在內的160多家企业,任务是管理和主导全球互联网技术标准,避免任何厂商利用关键技术自行提高网络使用价格与技术难度。从这一宗旨看,伯纳斯·李最有资格也最有权威担任该组织的主席。

伯纳斯·李认为,互联网应该是没有边际的,应该成为一个全球共享的网络。当初,他发明互联网的时候,就有一个理想,让它成为一个共同的信息空间,供大家以分享信息的方式进行沟通。一旦人们都在线上互动,就可以利用电脑分析、了解人类的行为,无疑将更有助于人类的合作与发展。

基于这样一个美好的理想,伯纳斯·李在互联网发明之后,选择了一条非营利的道路:没有把互联网据为己有,更没有从中牟利,而是把互联网无私地奉献给了全人类。

互联网为新经济提供了一个虚拟空间,其应用价值将越来越广泛。伯纳斯·李是“自由派的理想主义者”,他一直在致力于让互联网成为公共利益。他希望各国的教育工作者未來能够集合资源,创造出大量的线上教材,并免费把这些教育资源提供给那些原本没有条件受教育的人,特別是发展中国家的人民。他最不希望看到互联网的分裂,他说,“如果我们上网要用16个不同的浏览器来看不同的网站,那简直是一个天大的悲剧。”

伯纳斯·李造就了互联网,互联网也完善了伯纳斯·李的理想。他说,“如果互联网技术变成个人专利,被我一个人所控制,那么,互联网就不会得到今天这样的发展,如此普及的局面根本就不可能出现。”

对于互联网的未来,伯纳斯·李是这样构想的,用一个简易的超文件编辑软件,把互联网的应用变得更为简单,所有的人都能分享互联网带来的快乐,而且不必担心被他人骚扰和侵害。据悉,全球互联网联盟正在推行一项称为P3P的维护隐私计划,未来,上网者完全可以自行决定,要不要把个人信息提供给某一个网络服务器,还可以决定,用什么方式提供这些信息;同时,各网站都必须公布本身的网民隐私维护政策,并设置特定程序,自动警告网友注意某些网站。

美国《时代杂志》称伯纳斯·李为信息时代的无名英雄。但他认为:“我只不过是碰巧在合适的地方,合适的时间,做成了一项合适的技术合成”。

       这么多年来,贝尔实验室一直是众多重大发明的诞生地,也是世界上最著名的研发机构之一。20世纪的近四分之三的时间中,我们都在为贝尔实验室的发明而欢呼,并大大地受益于这些发明。

作为朗讯公司的研发机构,贝尔实验室的目的是要在与通讯相关的科学领域进行大量的基础研究,以获取能开发出新产品或新服务的创新知识。


改变世界的贝尔
贝尔实验室在全球30个国家拥有分支机构,有超过3万名技术人员在为其服务。

有人说,贝尔实验室的太阳永远都不会落下山。从印度的邦加罗尔(Bangalore,India),到日本的东京(Tokyo,Japan),到英国的斯文顿(Swindon,England),再到美国的硅谷(Silicon Valley,USA),世界各地都有贝尔实验室的研究和开发人员在致力于通讯领域的广泛而深入的研究。

20世纪30年代以来,贝尔实验室以其在多学科的基础和应用科学研究方面的成就,深深影响着世界通讯业的发展。这种传奇今天仍在上演。让我们来看贝尔实验室为我们带来了什么改变世界和生活的发明。
 

 ★ 晶体管   晶体管 ★ 

作为体积大、效率低的真空管和机械中继的替代物,晶体管于1947年在贝尔实验室开发完成,并带来了整个电子世界的一场革命。晶体管开创了一个现代技术的新纪元,带来了从载人航天飞机和计算机,到便携式收音机和立体声技术等发明创造。
 

 ★ 激光   激光 ★ 

激光的发明可以追溯到1958年贝尔实验室研究人员发表的一篇论文。激光开辟了一个新的科学研究领域,并打开了一个包括医疗、通信和消费类电子产品在内的巨大的市场。
 

 ★ 光通信   光通信 ★ 

宽带系统是互联网的基础。贝尔实验室在光电子(光技术)方面的进步包含从激光到光纤的各种技术。从事光网络研发的科学家继续在速度和容量方面创造着新的纪录。
 

 ★ 数据网络   数据网络 ★ 

自1925年传送了第一份传真开始,贝尔实验室不断地创造出利用网络提供语音业务之外的其他业务的方法。在20世纪80年代,贝尔实验室提高了调制解调器的速度并进行了全球第一个数字用户线路(DSL)技术试验。今天,DSL正成为普遍使用的将常规铜缆电话线转变为高速数据连接的技术,从而使用户可以更快地接入互联网。
 

 ★ 数字传输与交换   数字传输与交换 ★ 

1962年,贝尔实验室第一次对语音信号进行了数字复用传输。这一创新不仅为语音业务创造出一个更经济、稳定和灵活的网络设计,而且为诸如紧急呼叫、呼叫等待等先进的网络服务奠定了基础。此外,数字联网还是融合计算机和通信系统的基础。
 

 ★ 蜂窝电话技术   蜂窝电话技术 ★ 

上世纪40年代中期,贝尔实验室创造了蜂窝的概念,并开发出全球第一个商业化的移动电话服务。从此,贝尔实验室继续在无线领域不断创新,并创造了数字蜂窝电话技术,这一技术改善了话音质量,扩大了信道容量,并降低了费用。
 

 ★ 通信卫星   通信卫星 ★ 

1962年,贝尔实验室建造并成功推出全球第一个轨道式通信卫星Telstar-I。这一技术可以使电话呼叫横跨大洋和环绕地球。
 

 ★ 数字信号处理(DSP)   数字信号处理(DSP) ★ 

贝尔实验室于1979年制造出全球第一个单芯片数字信号处理器(DSP)。DSP是今天多媒体革命的引擎。DSP技术在许多领域发挥着作用,多媒体PC、调制解调器、无线电话、语音信箱、视频游戏、会说话的玩具、DVD播放机等等。DSP芯片还成为越来越多可以通过合成语音与您对话,并能够识别口语的系统的核心部件。
 

 ★ 按键电话   按键电话 ★ 

贝尔实验室于1963年首次推出用于取代旋转拨号电话的按键电话。从而带来了新一代的电话服务和能力,其中包括语音信箱和电话呼叫中心等应用。最近在美国进行的一项调查显示,按键电话被认为是20世纪最重要的商业通信进步之一。
 

 ★ Unix(r)操作系统和C(r)语言   Unix(r)操作系统和C(r)语言 ★ 

贝尔实验室在1969年到1972年间发明了Unix(r)操作系统和C程序设计语言。Unix(r)使分散的计算系统之间的大规模联网以及互联网成为可能。C语言则为程序设计带来了效率和表达的前所未有的组合。今天,Unix(r)是大多数大型互联网服务器以及商业和大学系统中使用的操作系统;而C语言及其延伸产品和技术则是世界上使用最广泛的程序设计语言。

贝尔的荣誉
在贝尔,研究人员以创纪录的速度将各种研发创意变为服务于客户的产品。迄今为止,贝尔实验室还在世界各地拥有2.6万多项有效的专利,平均每个工作日产生近4个专利技术。

贝尔实验室是全球拥有最多诺贝尔奖的机构。目前已有11位科学家6次获得诺贝尔奖,包括著名华裔科学家朱棣文博士和崔琦博士。除此之外,实验室的科学家们还9次获得美国国家科学奖章(U.S. Medals of Science)、6次获得美国国家技术奖章(U.S. Medals of Technology)。今天,这些成就激励着成千上万的贝尔人不断地构想、创新、完善各种已经在世界上领先的通讯技术,并为创建新一代的全球网络而努力。

作为体积大、效率低的真空管和机械中继的替代物,晶体管于1947年在贝尔实验室开发完成,并带来了整个电子世界的一场革命。晶体管开创了一个现代技术的新纪元,带来了从载人航天飞机和计算机,到便携式收音机和立体声技术等发明创造。
 

 ★ 激光   激光 ★ 

激光的发明可以追溯到1958年贝尔实验室研究人员发表的一篇论文。激光开辟了一个新的科学研究领域,并打开了一个包括医疗、通信和消费类电子产品在内的巨大的市场。
 

 ★ 光通信   光通信 ★ 

宽带系统是互联网的基础。贝尔实验室在光电子(光技术)方面的进步包含从激光到光纤的各种技术。从事光网络研发的科学家继续在速度和容量方面创造着新的纪录。
 

 ★ 数据网络   数据网络 ★ 

自1925年传送了第一份传真开始,贝尔实验室不断地创造出利用网络提供语音业务之外的其他业务的方法。在20世纪80年代,贝尔实验室提高了调制解调器的速度并进行了全球第一个数字用户线路(DSL)技术试验。今天,DSL正成为普遍使用的将常规铜缆电话线转变为高速数据连接的技术,从而使用户可以更快地接入互联网。
 

 ★ 数字传输与交换   数字传输与交换 ★ 

1962年,贝尔实验室第一次对语音信号进行了数字复用传输。这一创新不仅为语音业务创造出一个更经济、稳定和灵活的网络设计,而且为诸如紧急呼叫、呼叫等待等先进的网络服务奠定了基础。此外,数字联网还是融合计算机和通信系统的基础。
 

 ★ 蜂窝电话技术   蜂窝电话技术 ★ 

上世纪40年代中期,贝尔实验室创造了蜂窝的概念,并开发出全球第一个商业化的移动电话服务。从此,贝尔实验室继续在无线领域不断创新,并创造了数字蜂窝电话技术,这一技术改善了话音质量,扩大了信道容量,并降低了费用。
 

 ★ 通信卫星   通信卫星 ★ 

1962年,贝尔实验室建造并成功推出全球第一个轨道式通信卫星Telstar-I。这一技术可以使电话呼叫横跨大洋和环绕地球。
 

 ★ 数字信号处理(DSP)   数字信号处理(DSP) ★ 

贝尔实验室于1979年制造出全球第一个单芯片数字信号处理器(DSP)。DSP是今天多媒体革命的引擎。DSP技术在许多领域发挥着作用,多媒体PC、调制解调器、无线电话、语音信箱、视频游戏、会说话的玩具、DVD播放机等等。DSP芯片还成为越来越多可以通过合成语音与您对话,并能够识别口语的系统的核心部件。
 

 ★ 按键电话   按键电话 ★ 

贝尔实验室于1963年首次推出用于取代旋转拨号电话的按键电话。从而带来了新一代的电话服务和能力,其中包括语音信箱和电话呼叫中心等应用。最近在美国进行的一项调查显示,按键电话被认为是20世纪最重要的商业通信进步之一。
 

 ★ Unix(r)操作系统和C(r)语言   Unix(r)操作系统和C(r)语言 ★ 

贝尔实验室在1969年到1972年间发明了Unix(r)操作系统和C程序设计语言。Unix(r)使分散的计算系统之间的大规模联网以及互联网成为可能。C语言则为程序设计带来了效率和表达的前所未有的组合。今天,Unix(r)是大多数大型互联网服务器以及商业和大学系统中使用的操作系统;而C语言及其延伸产品和技术则是世界上使用最广泛的程序设计语言。

贝尔的荣誉
在贝尔,研究人员以创纪录的速度将各种研发创意变为服务于客户的产品。迄今为止,贝尔实验室还在世界各地拥有2.6万多项有效的专利,平均每个工作日产生近4个专利技术。

贝尔实验室是全球拥有最多诺贝尔奖的机构。目前已有11位科学家6次获得诺贝尔奖,包括著名华裔科学家朱棣文博士和崔琦博士。除此之外,实验室的科学家们还9次获得美国国家科学奖章(U.S. Medals of Science)、6次获得美国国家技术奖章(U.S. Medals of Technology)。今天,这些成就激励着成千上万的贝尔人不断地构想、创新、完善各种已经在世界上领先的通讯技术,并为创建新一代的全球网络而努力。

作为体积大、效率低的真空管和机械中继的替代物,晶体管于1947年在贝尔实验室开发完成,并带来了整个电子世界的一场革命。晶体管开创了一个现代技术的新纪元,带来了从载人航天飞机和计算机,到便携式收音机和立体声技术等发明创造。