2006年05月08日

Windows2003下搭建PHP环境

本例所用到的软件:
apache_2.0.55-win32-x86-no_ssl.msi
php-5.1.2-Win32.zip


将PHP文件包解压到D:\PHP,可以选择其它的路径但最好不要用中间有空格的路径(例如:C:\Program Files\PHP 就不太好),如果这样做有些 web 服务器会崩溃。
在D:\PHP目录中找到php.ini-recommended,并更名为php.ini;

要让 php5ts.dll 能正确被搜索到,有三个选择:复制该文件到 Windows 系统目录,复制该文件到 web 服务器的目录,或者把 PHP 目录(例如 D:\php)添加到 PATH 环境变量中。为了将来更好的维护,建议使用最后一个选择,将 PHP 目录添加到 PATH 环境变量中,因为这样更便于将来升级 PHP。
桌面右键单击“我的电脑”–“属性”
选择“高级”标签页
点击“环境变量”按钮
在“系统变量”栏中
找到 Path 这一项(可能需要向下滚动才能找到)
鼠标双击 Path 这一项
在最后加入你的 PHP 目录,包括前面的“;”(例如:;D:\php)
点击“确定”并重新启动电脑

确保在 php.ini 中正确设定了 extension_dir 和 doc_root 指令的值。这些指令依赖于 PHP 被安装的系统。在 PHP 5 中 extensions_dir 的一个取值例子是 "D:\php\ext",IIS 的 doc_root 的取值例子是 "c:\Inetpub\wwwroot"。
php在安装后是默认不支持读取mysql的,我们要修改php.ini文件,把
extension=php_mysql.dll
extension=php_gd2.dll
extension=php_mbstring.dll
前面的“;”去掉,注意,为了让php支持生成真彩图片,一般都要求支持gd2
找到
;session.save_path = "/tmp"
将’;'去掉 设置你保存session的目录,如 session.save_path = "D:/php/session_temp"
找到
;mbstring.language = Japanese
将’;'去掉改为mbstring.language = Chinese simplified
找到
;default_charset = "iso-8859-1"
将’;'去掉改为 default_charset = "gb2312"
找到
extension_dir = "./" 改为 extension_dir = "D:/php/ext"
 
用户(通常为 IUSR_MACHINENAME)需要能够读取各个文件和目录的权限,例如 php.ini,docroot 和 session 的 tmp 目录。


Apache + PHP
安装Apache,若是本机测试,
Network Domain 和 Server Name 均可填 localhost ;
安装目录可以改为D:\Apache
将以下几行加入到 D:\Apache\Apache2\conf 目录中的 httpd.conf 配置文件中以设定 Apache 2.0 的 PHP 模块:
LoadModule php5_module "D:/php/php5apache2.dll"
AddType application/x-httpd-php .php
# 配置 php.ini 的路径
PHPIniDir "D:/php"

配置apache里的httpd.conf
打开 D:\Apache\Apache2\conf\httpd.conf 这个文件 
找到 DocumentRoot "D:/Apache/Apache2/htdocs" 将其改为你的WEB目录(可不改)如我的为 DocumentRoot "D:/website"
找到 DirectoryIndex index.html index.html.var 在DirectoryIndex后面加入 index.php index.htm

打开浏览器,输入:http://localhost/,看到成功页面后,在 D:\Apache\Apache2\htdocs 下新建一个 phpinfo.php ,内容如下:
<?php
phpinfo();
?>
打开浏览器,输入:http://localhost/phpinfo.phphttp://localhost/phpinfo.php,将显示当前服务器所支持 PHP 的全部信息,可以看到 Server API的模式为:Apache 2.0 handler 。


IIS6.0 + PHP
1. PHP 可以安装为 CGI 或者 ISAPI 模块,建议使用后者。打开“IIS管理器”。然后右键点击 web 服务器节点(通常为“默认网站”),并选择“属性”。
要用 ISAPI 模块方式,按如下方法进行:
(如果不想用 PHP 进行 HTTP 认证,应该跳过这一步:在“ISAPI 筛选器”标签页中添加一个新的 ISAPI 筛选器。“筛选器名称”设为 PHP,“可执行文件”设为 php5isapi.dll 的路径。)

选择“主目录”标签页,然后进行:
将执行权限改为“纯脚本”
点“配置”按钮,选择“映射”标签页。点击“添加”按钮,将“可执行文件”指向适当的 ISAPI DLL。例如 PHP 5 的值是:D:\php\php5isapi.dll。在“扩展名”中填入 .php。选择“全部动作”(或者“限制为”留空),确定选中“脚本引擎”“检查文件是否存在”。点击“确定”。
完全停止 IIS(NET STOP iisadmin)
重新启动 IIS(NET START w3svc)

2. 打开 IIS 管理器,进入 web 服务扩展,点击“添加一个新的 web 服务扩展”,“扩展名”中输入名称,例如 PHP,再点击“添加”按钮,点击“浏览”选择 ISAPI 文件 php5isapi.dll 作为“文件路径”后点“确定”,然后选中“设置扩展状态为允许”并点“确定”。

要使用 index.php 作为默认文档,在“文档”标签页中选择“添加”。输入 index.php 并点“确定”。用上下箭头按钮调整顺序。这和在 Apache 中设定 DirectoryIndex 相似。

如果过些时候之后碰到 CPU 占用率达到 100%,则取消选中“缓存 ISAPI 应用程序”(“主目录”下点“配置”按钮”)。

3. 设定 PHPRC 环境变量:
桌面右键单击“我的电脑”–“属性”
选择“高级”标签页
点击“环境变量”按钮
在“系统变量”栏中
点击“新建”按钮并在“变量名”中输入“PHPRC”,在“变量值”中输入 php.ini 文件所在的目录(例如:D:\php)
点击“确定”并重新启动电脑

打开浏览器,输入:http://localhost/,看到成功页面后,在 C:\Inetpub\wwwroot 下新建一个 phpinfo.php ,内容如下:
<?php
phpinfo();
?>
打开浏览器,输入:http://localhost/phpinfo.phphttp://localhost/phpinfo.php,将显示当前服务器所支持 PHP 的全部信息,可以看到 Server API的模式为:ISAPI。

2006年04月19日

晚上在看Salman A. Baset和Henning Schulzrinne写的《An Analysis of the Skype Peer-to-Peer Internet Telephony Protocol》。因为Skype的通讯协议是不公开的,而且通讯内容是加过密的,这两位完全在实验的基础上对Skype的通讯机制进行分析,分析结果很有参考价值。

通过分析得出的结论主要有三个:
1、Skype的通话质量较MSN和Yahoo的即时通信工具要好;
2、可以无缝的在NATs和防火墙后使用;
3、安装使用起来确实非常简单。

skype_network.gif

Skype与以往MSN等IM工具最大的不同在于基除了用户登录,其余工作基本不依赖中央服务器,Skype在穿透防火墙通讯时完全使用了Peer to Peer,而没用到中央服务器。上图中的小黑点是客户端,大黑点是超级节点(用于为其它客户端提供登录踏板及广播服务),灰色的点是Skype的登录服务器。
用户下载安装完Skype后,Skype客户端会发送一段HTTP 1.1的请求到中央服务器,告诉它我装完了一个什么样的版本:

GET /ui/0/97/en/installed HTTP/1.1
User-Agent: Skype™ Beta 0.97
Host: ui.skype.com
Cache-Control: no-cache

服务器会返回一个200 OK的信息:

HTTP/1.1 200 OK
Date: Tue, 20 Apr 2004 04:51:39 GMT
Server: Apache/2.0.47 (Debian GNU/Linux) PHP/4.3.5
mod_ssl/2.0.47 OpenSSL/0.9.7b
X-Powered-By: PHP/4.3.5
Cache-control: no-cache, must revalidate
Pragma: no-cache
Expires: 0
Content-Length: 0
Content-Type: text/html; charset=utf-8
Content-Language: en

客户端会进行登录初始化工作,这一步工作包含很多内容,针对三种不同类型的网络情况有三种不同的登录方式:
1、直接有公众网的IP
2、在内部网,可以通过TCP访问外部网络
3、在内部网,但只能通过有限的几个端口(例如80和443)访问外部网络

Skype在登录的时候会先使用UDP请求HC中的IP,如果不行,就用TCP请求HC中的IP及端口,如果还不行,就用TCP请求HC中的IP及80端口,如果又不行,就再请求HC中的IP及443端口。如果这时候还不行,那就登录不了了。整个过程中传输的数据量大概在8k-10k,持续的时间在3至35秒。

1、端口
在Skype的连接属性对话框中可以设置监听的端口号,在安装的时候Skype会随机的选择一个端口作为监听的端口,这一点与HTTP协议等不同,Skype没有默认的服务端口。同时,它还会打开对80和443端口的监听。80是常见的HTTP服务默认端口,而443则是HTTPS服务的默认端口。
2、主机列表(HC,Host Cache)
这里的主机指的是可以提供踏板及广播服务的Super Node(SN)。通常它被存储在注册表里的:HKEY_CURRENT_USER / SOFTWARE / SKYPE / PHONE / LIB / CONNECTION / HOSTCACHE 中.一般情况下,运行两天后,HC中会有约200个机器地址及对应的端口号。

3、编解码器
要能语音通信,编解码器当然少不了。Global IP Sound在他的网站上专用明它为Skype提供点对点语音通讯软件:Global IP Sound provides voice processing software to Skype’s peer-to-peer voice-communications software.Skype应该是使用了他们的编解码器实现的语音通讯。

4、好友列表
当你换了一台计算机的时候可能会发现Skype上的好友列表没了,不要奇怪,Skype的好友列表没有保存在服务器上,而是保存在本地的注册表中,当然,是加过密的。

5、加密
Skype使用AES加密标准。

6、NAT与防火墙
Skype应该是使用了STUN和TURN协议来检测所处的NAT及防火墙环境。Skype定期的刷新这些信息,这些信息也是存储在注册表中的。与另外一个点对点文件共享系统Kazza不同,普通客户端无法阻止自己成为Super Node(SN),就是说它随时可能被征用成为别人登录服务和广播服务的提供者,就是类似于BT中的种子提供者的角色。

Skype的功能主要可以分为:初始化,登录,用户搜索,呼叫建立与终止,媒体传输和状态消息。

1、初始化
第一次安装后,Skype会发送一段HTTP 1.1的请求给中央服务器,包括关键字"installed"以及所装Skype的版本号。以后的每次登录Skype都会向中央服务器发送一小段包含关键字"getlatestversion"的HTTP 1.1请求,检查是否有新版本的Skype。

2、登录
登录可能是Skype最重要的功能。在这个过程中,Skype终端到登录服务器上验证用户名密码,广播他在上线给好友及其它的点,检查NAT和防火墙的类型,发现拥有公网IP地址的在线Skype节点,这些新发现的节被用于在所在Super Node无法使用后继续保持本机与Skype网络的连接。

登录的过程我们前面已经讲过,先用UDP连,然后是TCP,然后TCP到80,然后TCP到443,行的话就连上了,不行的话就显示无法登录。连接的对象是保存在本机中Host Cache中的。

登录服务器的IP是80.160.91.11,nslookup记录显示它的域名是:ns14.inet.tele.dk和ns15.inet.tele.dk,dk是丹麦的国家定级域名。

安装完第一次登录时,HC被初始化,里面包含7对IP与端口,而且基本总是这7个IP和端口,即使包含超过7对,这7对也在其中。当用户安装后第一次登录时,Skype通过其中的一对IP和端口建立TCP连接。

这7个IP-端口对,以及这些IP对应的主机名是:
IP address:port Reverse lookup result
66.235.180.9:33033 sls-cb10p6.dca2.superb.net
66.235.181.9:33033 ip9.181.susc.suscom.net
80.161.91.25:33033 0×50a15b19.boanxx15.adsl-dhcp.tele.dk
80.160.91.12:33033 0×50a15b0c.albnxx9.adsl-dhcp.tele.dk
64.246.49.60:33033 rs-64-246-49-60.ev1.net
64.246.49.61:33033 rs-64-246-49-61.ev1.net
64.246.48.23:33033 ns2.ev1.net
可以看到上述的主机分别属于4个ISP,其中Superb , Suscom, ev1.net是美国的ISP。

参考资料:
《An Analysis of the Skype Peer-to-Peer Internet Telephony Protocol》

DAN KEGEL 原著 sunkinglang译
Peer-to-peer是一种网络形式,基于它,网络中的计算机可以直接沟通,而不需要一台中央服务器。这种技术通常被应用在多玩家在线游戏,例如Activision的战网,以避免处理服务器数据流所引起的延迟与消耗,但这种联网形式常常会碰到网络地址解析的问题(NAT)。本文中,我将描述解决这些问题的方法。使用这种技术的产品现在已经能在一些商业性NAT中正确运行了。

背景

互联网是基于32位IP地址的,这意味着互联网理论上最大电脑数目约为四万亿。由于IP地址使用方式的无效性,实际的数量会少得多。实际上,互联网过不了多久就会将IP地址用完。

因为可用的IP地址越来越少,一种被称为网络地址解析或箭称NAT的技术被开发出来,它允许以一个IP地址来代表整个网络的电脑。

一个NAT处在公用互联网与它所服务的网络之间,重写数据中IP头部的IP地址和端口号以使所有的包看上去都象从一个NAT设备的公用IP地址发来(或到它去)的,而不是发自(往)实际的源或者目标。

NAT如今已经在小型家庭-办公室路由被普遍租用,也在很多软件中被用户使用以连接几台PC到一个唯一的电缆MODEM。它甚至被一些ISP使用。

(NAT不是唯一可能的解决办法,代理服务器也被普遍使用,但需要更多的配置,有时还需要要定制的客户端软件。而最终,我们都将转换到IPv6,它将使用128位地址,可以解决已有的及所有的问题,但那将在很久后才会普及。

某些协议是非NAT友好的


一些应用程序将IP和端口号隐藏在它们的数据包中发送,NAT不能正确重写它们,所以当你想在NAT网络内使用那些程序的话,它们将不会正确运行。

一些NAT,由于安全原因,只允许从已经发送过数据去的外部地址接收数据。这意味着处于不同NAT后的两个人不能以通常的方式建立连接。

解决办法


希望NAT友好的Peer-to-peer(点对点)协议必须明确:其所嵌入数据包的任何地址在通过NAT时都可能变得无效,因此需要补救。一个可行的方法如下:

两点之间所有的数据流都通过一个单一的UDP端口。存在着一个不处于任何NAT之后的地址服务器,用户首先与地址服务器连接,并发送他们认为拥有的IP地址;服务器标记该地址和它在UDP头部所看到的地址。然后服务器将两个地址都送往其它点。这样,所有人都知道其它人的地址。

为打开点对点的连接,所有的旧(结)点发送一个UDP包到新的(结)点,且新(结)点发送一个UDP包到每一个老(结)点。因为无人知道开始它们是否处于同一个NAT之后,第一个包往往被同时送往公有和私有地址。

这导致每个人的NAT为UDP数据流的通过打开一个双向的洞。一旦第一个响应从每个(结)点返回,发送者就知道使用哪个返回地址,并能停止向两个地址发送数据。

兼容性需求


基于和超越基本的NAT RFC,一个想支持这个技术的NAT设备必须有以下要求的属性:

>>NAT不允许改变被数据流使用的UDP端口号。
如果一个处于NAT之后的主机从一个单一的UDP口发送了一系列的包,被NAT接棒后的包也必须表现为来自同一主机和UDP口。

RFC蓝图


我正在拟订这项技术RFC蓝图更为详细的细节。如果你感兴趣,请与我联系。

兼容性测试结果


我正在测试实现几个NAT通讯的兼容性。这里是部分结果:

已知的NAT实现的兼容性


>>NAT1000:完全兼容。感谢Nevod技术人员早期所帮助做的兼容性测试。无任何东西需要改变;这项技术与他们的NAT一起运行很稳定。Nevod已经不再存在了,它已被微软兼并。
>>Win98 SE包含的网络联接共享软件,起源于NAT1000,所以一定运行良好。
>>SYGATE:完全兼容。
>>NAT32:1999年1月5号公布的BETA测试版完全兼容。现在公布的版本也应该完全兼容。
>>LINUX IP Masquerading(LINUX IP伪装):2.2.1版本内核和后续版本可以正常运行。请到http://juanjox.linuxhq.com/?寻找早期2.1版本的补丁。2.0版本的补丁见Glenn Lamb的页面:http://home.indyramp.com/lists/masq/msg03024.html
ftp://ftp.netcom.com/pub/mu/mumford/loose-udp-2.0.36.patch.gz
Glenn的端口使之拥有一个配置时选项CONFIG_IP_MASQ_LOOSE_UDP,这是一个很好的举措。
>>WinNAT:当前版本工作正常。

NAT实现即将可兼容的


>>Arescom Apex 1100 ISDN路由:Arescom在1999年1月针对此问题发布了一个固件补丁;也许现在已经并入其标准固件里了,但我还没有证实。
>>Vicomsoft Softrouter Plus:Vicom曾公布过一个版本以解决这个问题,但我还没有机会来测试一下。注意:为使这个实现正常运行,你必须把网关设备上除指向内部以太适配器外的所有本地TCP绑定禁止。在使用Vicom的安装助手之前请阅读其文档。

未知是否兼容的


>>Cisco IOS有一内置的NAT兼容特性,也许有用也许不然。
>>我们已经测试了我们手上所有能得到的WIN32软件。但还没有测试嵌入到许多小型家庭办公路由中的NAT,也没有测试外置的NAT如SonicWall等。

不兼容的


>>所有的纯代理服务器解决办法,如WINGATE2或者PPPShar,都不能正常运行。

使用这项技术的软件


以下软件包是已知的支持在NAT后操作的:
>>Civilization: Call To Power
>>Heavy Gear 2

讨论区


我想听到其它开发者对于这项技术的想法,以及Masq如何被重写以正确复用UDP端口。加入NAT-peer-games(http://onelist.com/viewarchive.cgi?listname=nat-peer-games)邮件列表让我们一起讨论。

实施问题


在测试SYGATE和近期NAT1000版本时,我遇到一些实施方面的问题。当运行网关的机器是通过MODEM与INTERNET联接的话所有一切均正常。但如果网关机器是通过以太网与INTERNET联接的话,客户端不能访问那个外部以太网上的其它主机。看上去就象那台网关送出来的包完全被外部以太网上的其它主机丢弃了。然而路由器不会丢弃数据,所以与远程主机联接没有问题。想了解更多信息,请到my Usenet post(http://www.dejanews.com/getdoc.xp?AN=427631763)获取。

我倾向于相信这是硬件原因,但谁知道呢…

链接

>>IETF Working Group on NAT:
http://www.ietf.org/html.charters/nat-charter.html
新的RFC草图和邮件列表。其中一个文档
http://www.ietf.org/internet-drafts/draft-ietf-nat-protocol-issues-01.txt
提到这项技术;搜索关键词“Activision”

>>NAT页面:
http://www.uq.edu.au/~gadmacka/the-nat-page/
列出了一些可行的NAT实现

>>LINUX IP伪装:
http://www.indyramp.com/masq/
都是关于NAT实现的LINUX之Masq。

>>MASQ邮件列表的可查询索引:
http://www.mail-archive.com/masq@tori.indyramp.com/

>>LINUX IP NAT论坛:
http://serf.csn.tu-chemnitz.de/HyperNews/get/linux-ip-nat.html
NAT论文,老式的不支持的LINUX NAT实现和一个讨论区。多半为了历史兴趣。

NAT原理简介

NAT英文全称是“Network Address Translation”,中文意思是“网络地址转换”,它是一个IETF(Internet Engineering Task Force, Internet工程任务组)标准,允许一个整体机构以一个公用IP(Internet Protocol)地址出现在Internet上。顾名思义,它是一种把内部私有网络地址(IP地址)翻译成合法网络IP地址的技术。如图:

附图

  简单地说,NAT就是在局域网内部网络中使用内部地址,而当内部节点要与外部网络进行通讯时,就在网关(可以理解为出口,打个比方就像院子的门一样)处,将 内部地址替换成公用地址,从而在外部公网(internet)上正常使用,NAT可以使多台计算机共享Internet连接,这一功能很好地解决了公共 IP地址紧缺的问题。通过这种方法,您可以只申请一个合法IP地址,就把整个局域网中的计算机接入Internet中。这时,NAT屏蔽了内部网络,所有 内部网计算机对于公共网络来说是不可见的,而内部网计算机用户通常不会意识到NAT的存在。如图2所示。这里提到的内部地址,是指在内部网络中分配给节点 的私有IP地址,这个地址只能在内部网络中使用,不能被路由(一种网络技术,可以实现不同路径转发)。虽然内部地址可以随机挑选,但是通常使用的是下面的 地址:10.0.0.0~10.255.255.255,172.16.0.0~172.16.255.255, 192.168.0.0~192.168.255.255。NAT将这些无法在互联网上使用的保留IP地址翻译成可以在互联网上使用的合法IP地址。而全 局地址,是指合法的IP地址,它是由NIC(网络信息中心)或者ISP(网络服务提供商)分配的地址,对外代表一个或多个内部局部地址,是全球统一的可寻 址的地址。

附图

  NAT 功能通常被集成到路由器、防火墙、ISDN路由器或者单独的NAT设备中。比如Cisco路由器中已经加入这一功能,网络管理员只需在路由器的IOS中设 置NAT功能,就可以实现对内部网络的屏蔽。再比如防火墙将WEB Server的内部地址192.168.1.1映射为外部地址202.96.23.11,外部访问202.96.23.11地址实际上就是访问访问 192.168.1.1。另外资金有限的小型企业来说,现在通过软件也可以实现这一功能。Windows 98 SE、Windows 2000 都包含了这一功能。

NAT技术类型

  NAT有三种类型:静态NAT(Static NAT)、动态地址NAT(Pooled NAT)、网络地址端口转换NAPT(Port-Level NAT)。

  其中静态NAT设置起来最为简单和最容易实现的一种,内部网络中的每个主机都被永久映射成外部网络中的某个合法的地址。而动态地址NAT则是在外部网络中定 义了一系列的合法地址,采用动态分配的方法映射到内部网络。NAPT则是把内部地址映射到外部网络的一个IP地址的不同端口上。根据不同的需要,三种 NAT方案各有利弊。

  动态地址NAT只是转换IP地址,它为每一个内部的IP地址分配一个临时的外部IP地址,主要应用于拨号,对于频繁的远程联接也可以采用动态NAT。当远程用户联接上之后,动态地址NAT就会分配给他一个IP地址,用户断开时,这个IP地址就会被释放而留待以后使用。

  网络地址端口转换NAPT(Network Address Port Translation)是人们比较熟悉的一种转换方式。NAPT普遍应用于接入设备中,它可以将中小型的网络隐藏在一个合法的IP地址后面。NAPT与 动态地址NAT不同,它将内部连接映射到外部网络中的一个单独的IP地址上,同时在该地址上加上一个由NAT设备选定的TCP端口号。

  在Internet 中使用NAPT时,所有不同的信息流看起来好像来源于同一个IP地址。这个优点在小型办公室内非常实用,通过从ISP处申请的一个IP地址,将多个连接通 过NAPT接入Internet。实际上,许多SOHO远程访问设备支持基于PPP的动态IP地址。这样,ISP甚至不需要支持NAPT,就可以做到多个 内部IP地址共用一个外部IP地址上Internet,虽然这样会导致信道的一定拥塞,但考虑到节省的ISP上网费用和易管理的特点,用NAPT还是很值 得的。

2006年04月12日

Base64

    Base64和下面将要介绍的Quoted-Printable都属于MIME(多部分( multi-part)、多媒体电子邮件和 WWW 超文本的一种编码标准,用于传送诸如图形、声音和传真等非文本数据)。MIME定义在RFC1341中。

    Base64是现今在互联网上应用最多的一种编码,几乎所有的电子邮件软件头把它作为默认的二进制编码,它已经成了现今电子邮件编码的代名词。

    下面是Base64的一个例子,从例子中,您也可以看到Base64与电子邮件的的紧密联系:

Content-Type: text/plain;charset="cn-gb"

Content-Transfer-Encoding: BASE64

 

CQkJICAgIKG2wtLC68vjt6i088irobcNCgnX99XfOm1vZ2Fvo6yw19TGu8a619W+o6h0ZWxuZXQ6

Ly8yMDIuMTEyLjIwLjEzMjoyM6Ops8nUsaGjDQoJICAgICAgxKq438jtvP65pNf3ytKjumh0dHA6

Ly9tb2dhby5iZW50aXVuLm5ldA0KCQkJRW1haWx0bzptb2dhb0AzNzEubmV0DQoJICAgKioqKioq

KioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqICAgICAgICAgICAgICAgDQoJ

ICAgKiCz/cHLvMfS5Mqyw7S2vLK7tPjX36Oss/3By9fjvKPKssO0tryyu8H0z8IqDQoJICAgKioq

KioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioq

 

    你可以把它单独存成一个文件,可以取名为:mogao.eml,双击可以用OutLook打开(前两行为邮件的原始信息,从第四行开始为编码内容)。

    Base64的算法同Uuencode的算法很接近,也很简单:它将字符流顺序放入一个 24 位的缓冲区,缺字符的地方补零。然后将缓冲区截断成为 4 个部分,高位在先,每个部分 6 位,用下面的64个字符重新表示:“ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/”。如果输入只有一个或两个字节,那么输出将用等号“=”补足。这可以隔断附加的信息造成编码的混乱。它每行一般为76个字符。

    下面我给出Base64的编码和解码的C语言描述:

/*Base64编码*/

void Base64(unsigned char chasc[3],unsigned char chuue[4])

/* 

  chasc:未编码的二进制代码

  chuue:编码过的Base64代码

*/

{

 int i,k=2;

 unsinged char t=NULL;

 for(i=0;i<3;i++)

 {

  *(chuue+i)=*(chasc+i)>>k;

  *(chuue+i)|=t;

  t=*(chasc+i)<<(8-k);

  t>>=2;

  k+=2;

 }

 *(chuue+3)=*(chasc+2)&63;

 

 for(i=0;i<4;i++)

    if((*(chuue+i)>=0)&&(*(chuue+i)<=25)) *(chuue+i)+=65;

    else if((*(chuue+i)>=26)&&(*(chuue+i)<=51)) *(chuue+i)+=71;

    else if((*(chuue+i)>=52)&&(*(chuue+i)<=61)) *(chuue+i)-=4;

    else if(*(chuue+i)==62) *(chuue+i)=43;

    else if(*(chuue+i)==63) *(chuue+i)=47;

 

}

/*Base64解码*/

void unBase64(unsigned char chuue[4],unsigned char chasc[3])

/* 

chuue:未解码的Base64代码

chasc:解码过的二进制代码

*/

{int i,k=2;

 unsigned char t=NULL;

 

 for(i=0;i<4;i++)

     if((*(chuue+i)>=65)&&(*(chuue+i)<=90)) *(chuue+i)-=65;

     else if((*(chuue+i)>=97)&&(*(chuue+i)<=122)) *(chuue+i)-=71;

     else if((*(chuue+i)>=48)&&(*(chuue+i)<=57)) *(chuue+i)+=4;

     else if(*(chuue+i)==43) *(chuue+i)=62;

     else if(*(chuue+i)==47) *(chuue+i)=63;

     else if(*(chuue+i)==61) *(chuue+i)=0;

 

 for(i=0;i<3;i++)

 {*(chhex+i)=*(chuue+i)<<k;

  k+=2;

  t=*(chuue+i+1)>>8-k;

  *(chhex+i)|=t;

 }

}

以下是VB代码:

Base64的程序,入口函数是Encode(bytFile() as Byte),bytFile是一个Byte型的数组,返回一个字符串。对了,传入的数组不大于32767个元素
———————————————————-
Private m_bytIndex(0 To 63) As Byte


‘****************************************************
‘*                                                  *
‘*– To encode file data with Base64 method.        *
‘*                                                  *
‘****************************************************
Public Function Encode(bytFile() As Byte) As String
    
    Dim i As Long, j As Long
    Dim strRslt As String
    
    i = 0
    
    For i = 0 To UBound(bytFile) – ((UBound(bytFile) + 1) Mod 3) Step 3
        strRslt = strRslt + Chr(m_bytIndex(Int((bytFile(i) And 252) / 4)))
        strRslt = strRslt + Chr(m_bytIndex(Int((bytFile(i) And 3) * 16 + (bytFile(i + 1) And 240) / 16)))
        strRslt = strRslt + Chr(m_bytIndex(Int((bytFile(i + 1) And 15) * 4 + (bytFile(i + 2) And 192) / 64)))
        strRslt = strRslt + Chr(m_bytIndex(Int(bytFile(i + 2) And 63)))
    Next i
    
    Select Case ((UBound(bytFile) + 1) Mod 3)
        Case 1
            strRslt = strRslt + Chr(m_bytIndex(Int((bytFile(UBound(bytFile)) And 252) / 4)))
            strRslt = strRslt + Chr(m_bytIndex(Int((bytFile(UBound(bytFile)) And 3) * 16)))
            strRslt = strRslt + "=="
        Case 2
            strRslt = strRslt + Chr(m_bytIndex(Int((bytFile(UBound(bytFile) – 1) And 252) / 4)))
            strRslt = strRslt + Chr(m_bytIndex(Int((bytFile(UBound(bytFile) – 1) And 3) * 16 + (bytFile(UBound(bytFile)) And 240) / 16)))
            strRslt = strRslt + Chr(m_bytIndex(Int((bytFile(UBound(bytFile)) And 15) * 4)))
            strRslt = strRslt + "="
    End Select
    Encode = strRslt
    
End Function


‘****************************************************
‘*                                                  *
‘*– Class Initialize to initialize the array of    *
‘*   base64 coding.                                 *
‘*                                                  *
‘****************************************************
Private Sub Class_Initialize()
    
    m_bytIndex(0) = 65 ‘Asc("A")
    m_bytIndex(1) = 66 ‘Asc("B")
    m_bytIndex(2) = 67 ‘Asc("C")
    m_bytIndex(3) = 68 ‘Asc("D")
    m_bytIndex(4) = 69 ‘Asc("E")
    m_bytIndex(5) = 70 ‘Asc("F")
    m_bytIndex(6) = 71 ‘Asc("G")
    m_bytIndex(7) = 72 ‘Asc("H")
    m_bytIndex(8) = 73 ‘Asc("I")
    m_bytIndex(9) = 74 ‘Asc("J")
    m_bytIndex(10) = 75 ‘Asc("K")
    m_bytIndex(11) = 76 ‘Asc("L")
    m_bytIndex(12) = 77 ‘Asc("M")
    m_bytIndex(13) = 78 ‘Asc("N")
    m_bytIndex(14) = 79 ‘Asc("O")
    m_bytIndex(15) = 80 ‘Asc("P")
    m_bytIndex(16) = 81 ‘Asc("Q")
    m_bytIndex(17) = 82 ‘Asc("R")
    m_bytIndex(18) = 83 ‘Asc("S")
    m_bytIndex(19) = 84 ‘Asc("T")
    m_bytIndex(20) = 85 ‘Asc("U")
    m_bytIndex(21) = 86 ‘Asc("V")
    m_bytIndex(22) = 87 ‘Asc("W")
    m_bytIndex(23) = 88 ‘Asc("X")
    m_bytIndex(24) = 89 ‘Asc("Y")
    m_bytIndex(25) = 90 ‘Asc("Z")
    m_bytIndex(26) = 97 ‘Asc("a")
    m_bytIndex(27) = 98 ‘Asc("b")
    m_bytIndex(28) = 99 ‘Asc("c")
    m_bytIndex(29) = 100 ‘Asc("d")
    m_bytIndex(30) = 101 ‘Asc("e")
    m_bytIndex(31) = 102 ‘Asc("f")
    m_bytIndex(32) = 103 ‘Asc("g")
    m_bytIndex(33) = 104 ‘Asc("h")
    m_bytIndex(34) = 105 ‘Asc("i")
    m_bytIndex(35) = 106 ‘Asc("j")
    m_bytIndex(36) = 107 ‘Asc("k")
    m_bytIndex(37) = 108 ‘Asc("l")
    m_bytIndex(38) = 109 ‘Asc("m")
    m_bytIndex(39) = 110 ‘Asc("n")
    m_bytIndex(40) = 111 ‘Asc("o")
    m_bytIndex(41) = 112 ‘Asc("p")
    m_bytIndex(42) = 113 ‘Asc("q")
    m_bytIndex(43) = 114 ‘Asc("r")
    m_bytIndex(44) = 115 ‘Asc("s")
    m_bytIndex(45) = 116 ‘Asc("t")
    m_bytIndex(46) = 117 ‘Asc("u")
    m_bytIndex(47) = 118 ‘Asc("v")
    m_bytIndex(48) = 119 ‘Asc("w")
    m_bytIndex(49) = 120 ‘Asc("x")
    m_bytIndex(50) = 121 ‘Asc("y")
    m_bytIndex(51) = 122 ‘Asc("z")
    m_bytIndex(52) = 48 ‘Asc("0")
    m_bytIndex(53) = 49 ‘Asc("1")
    m_bytIndex(54) = 50 ‘Asc("2")
    m_bytIndex(55) = 51 ‘Asc("3")
    m_bytIndex(56) = 52 ‘Asc("4")
    m_bytIndex(57) = 53 ‘Asc("5")
    m_bytIndex(58) = 54 ‘Asc("6")
    m_bytIndex(59) = 55 ‘Asc("7")
    m_bytIndex(60) = 56 ‘Asc("8")
    m_bytIndex(61) = 57 ‘Asc("9")
    m_bytIndex(62) = 43 ‘Asc("+")
    m_bytIndex(63) = 47 ‘Asc("/")

End Sub

2006年03月31日

仅仅概念了,其实web2.0熟悉了解的,每个人都有自己的一些想法看法,不过下面的是我从其他地方转过来的,算是挺全面和综合了,不过技术方面介绍更多些.web2.0理念上所带来的改变和特点那就太多了.
Web2.0,是相对Web1.0(2003年以前的互联网模式)的新的一类互联网应用的统称,是一次从核心内容到外部应用的革命。由Web1.0单纯通过网络浏览器浏览html网页模式向内容更丰富、联系性更强、工具性更强的Web2.0互联网模式的发展已经成为互联网新的发展趋势。

Web1.0到Web2.0的转变,具体的说,从模式上是单纯的“读”向“写”、“共同建设”发展;由被动地接收互联网信息向主动创造互联网信息迈进!从基本构成单元上,是由“网页”向“发表/记录的信息”发展;从工具上,是由互联网浏览器向各类浏览器、rss阅读器等内容发展;运行机制上,由“Client Server”向“Web Services”转变;作者由程序员等专业人士向全部普通用户发展;应用上由初级的“滑稽”的应用向全面大量应用发展。
总之,Web2.0是以 Flickr、Craigslist、Linkedin、Tribes、Ryze、 Friendster、Del.icio.us、43Things.com等网站为代表,以Blog、TAG、SNS、RSS、wiki等应用为核心,依据六度分隔、xml、ajax等新理论和技术实现的互联网新一代模式。

应用:
1、 Blog(from wiki)
历史:
Blog一词本起源于 weblog,意思是网上日志。1997年由 Jorn Barger所提出。在1998年, infosift 的编辑Jesse J. Garrett (http://www.jjg.net),将一些类似blog的网站收集起来,寄给Cameron Barrett。 Cameron随后将名单发布在CamWorld网站上,许多人亦陆续将blog的URL给Cameron,慢慢的,一个新的网络社区俨然成型。1999年,Brigitte Eaton (http://www.eatonweb.com)成立一个weblog 目录,收集她所知道的blog站。1999年,Peter Merholz (http://www.peterme.com)首次使用缩略词“blog”,成为今天常用的术语。但是,blog 真正开始快速发展的转折点,是在1999年6月,当时Pitas开始提供免费的weblog服务,紧接着8月,Pyra lab推出了现在的blogger.com。blogger.com 提供了简单易学的说明,以及能通过FTP直接将blog发表在个人网站上的功能,这带给使用者很大的方便。目前已经有了很多Blog托管服务商(BSP),业内人士对其盈利前景,持谨慎乐观态度。
Blog的特点
Blog是个人或群体以时间顺序所作的一种记录,并且不断更新。blog之间的交流主要是通过回溯引用(TrackBack)和回响/留言/评论(comment)的方式来进行的。blog的操作管理用语,也借鉴了大量档案管理用语。一个blog亦可被视为一个档案(archives),或是卷宗(fonds)。与传统档案不同的是,blog的写作者(blogger),既是这份档案的创作人(creator),也是其档案管理人(archivist)。

Blog大量采用了RSS(Really Simple Syndication或者Rich Site Summary或者RDF Site Summary)技术,所有的RSS文件都必须符合由W3C发布的XML 1.0规范。对读者来说,可以通过RSS订阅一个blog,确知该blog作者最近的更新。对Blog作者来说,RSS可以使自己发布的文章易于被计算机程序理解并摘要。

对知识管理和创造而言,blog提供了新的形态和途径。对汉语为母语的人而言,blog写作既接续了汉语笔记文学的优秀传统,更充分鼓励了个人表达。从交往形态考察,网志空间(blogosphere)设定了积极的读者、作者、编者互动转换关系,“言者互重,阅者相惜 ”。

2、 Tag (from blogbus)
什么是Tag?
Tag(标签)是一种更为灵活、有趣的日志分类方式,您可以为每篇日志添加一个或多个Tag(标签),然后您可以看到BlogBus上所有和您使用了相同Tag的日志,并且由此和其他用户产生更多的联系和沟通。不仅如此,我们还通过与Technorati的合作,把您的Tag发送到全球Blog空间,和全世界的人们共同分享。
Tag体现了群体的力量,使得日志之间的相关性和用户之间的交互性大大增强,可以让您看到一个更加多样化的世界,一个关联度更大的Blog空间,一个热点实时播报的新闻台。Tag为您提供前所未有的网络新体验……
当然,您也可以简单地把一个Tag(标签)理解为一个日志分类,但是Tag和分类的不同之处也很明显:
首先,分类是您在写日志之前就定好的,而Tag是在您写完日志之后再添加的;
其次,您可以同时为一篇日志贴上好几个Tag(标签),方便自己随时查找,而原先一篇日志只能有一个分类;
再次,当您积累了一定数量的Tag之后,您可以看看自己在Blog中最经常写的是哪些话题;
最后,您可以看到有哪些人和自己使用了一样的Tag(标签),进而找到和您志趣相投的Blogger。
举一个例子,比如说:您写了一篇到西湖旅游的日志,原来您都是把这一类的日志放到自己的“驴行天下”分类下,但是有了Tag之后,您可以给这篇日志同时加上“旅游”、“杭州”、“西湖”、“驴行天下”等几个Tag,当浏览者点击其中任何一个Tag,他都可以看到您的这篇日志。同时您自己也可以通过点击这几个Tag,看看究竟有谁最近也去了杭州旅游,或许你们还可以交流一下旅游心得,成为下一次出游的伙伴呢!

3、 SNS
Social Network Service,社会性网络软件,依据六度理论,以认识朋友的朋友为基础,扩展自己的人脉。并且无限扩张自己的人脉,在需要的时候,可以随时获取一点,得到该人脉的帮助。

SNS网站,就是依据六度理论建立的网站,帮你运营朋友圈的朋友。

4、 RSS(from wiki)
RSS是一种用于共享新闻和其他Web内容的数据交换规范,起源于网景通讯公司的推"Push"技术,将订户订阅的内容传送给他们的通讯协同格式(Protocol)。RSS可以是以下三个解释的其中一个:

Really Simple Syndication(真正简单的整合)
RDF (Resource Description Framework) Site Summary
Rich Site Summary(丰富站点摘要)
但其实这三个解释都是指同一种Syndication的技术。

目前RSS规范的主要版本有0.91、1.0和2.0。

0.91版和1.0版完全不同,风格不同,制定标准的人也不同。0.91版和2.0版一脉相承。1.0版更靠拢XML标准。

RSS目前广泛用于blog、wiki和网上新闻频道,世界多数知名新闻社网站都提供RSS订阅支持。

5、 Wiki(from wiki)
Wiki一词源自夏威夷语的「wee kee wee kee」,本是「快点快点」之意。在这里Wiki指的是一种超文本系统。这种超文本系统系支持那些面向社群的协作式写作,同时也包括一组支持这种写作的辅助工具。有人认为,Wiki系统属於一种人类知识的网路系统,我们可以在Web的基础上对Wiki文本进行浏览、创建、更改,而且这种创建、更改、及发布的代价远比HTML文本小;与此同时Wiki系统还支持那些面向社群的协作式写作,为协作式写作提供了必要的帮助;最后,Wiki的写作者自然构成了一个社群,Wiki系统为这个社群提供了简单的交流工具。与其它超文本系统相比,Wiki有使用简便且开放的优点,所以Wiki系统可以帮助我们在一个社群内共用某个领域的知识。
Wiki起源
1995年沃德?坎宁安(Ward Cunningham)为了方便模式社群的交流创建了全世界第一个wiki系统-WikiWikiWeb,并用它建立了波特兰模式知识库(Portland Pattern Repository)。在建立这个系统的过程中,沃德?坎宁安创造了Wiki的概念和名称,并且实现了支持这些概念的服务系统。这个系统是最早的Wiki系统。从1996年至2000年间,波特兰模式知识库围绕著面向社群的协作式写作,不断发展出一些支持这种写作的辅助工具,从而使Wiki的概念不断得到丰富。同时Wiki的概念也得到了传播,出现了许多类似的网站和软体系统。
Wiki的历史不长,无论是Wiki概念本身,还是相关软体系统的特性,都还在热烈的讨论中;所以怎样的一个站点才能称得上是一个Wiki系统还是有争议的。与Wiki相关新近出现的技术还有blog,它们都降低了超文本写作和发布的难度。这两者都是同内容管理系统密切相关的。
Wiki的特点
使用方便
维护快捷:快速创建、存取、更改超文本页面(这也是为什麼叫作 "wiki wiki" 的原因)。
格式简单:用简单的格式标记来取代 HTML 的复杂格式标记。(类似所见即所得的风格)
链接方便:通过简单标记,直接以关键字名来建立链接(页面、外部连接、图像等)。
命名平易:关键字名就是页面名称,并且被置於一个单层、平直的名空间中。
可增长
可增长:页面的链接目标可以尚未存在,通过点击链接,我们可以创建这些页面,从而使系统得以增长。
修订历史:记录页面的修订历史,页面的各个版本都可以被获取。
开放性
开放的:社群内的成员可以任意创建、修改、或删除页面。
可观察:系统内页面的变动可以被来访者清楚观察得到。
由於Wiki的自组织,可增长以及可观察的特点,使Wiki本身也成为一个网路研究的对象。对Wiki的研究也许能够让人们对网路的认识更加深入

理论和技术:
1、 六度关系理论
目前流行的“六度分隔”理论是20世纪60年代由美国的心理学家米格兰姆(Stanley Milgram)提出的,这个理论可以通俗地阐述为: 最多通过六个人你就能够认识任何一个陌生人。“六度分隔”成为人际关系世界中无可否认而又令人震惊的特征,许多社会学上的深入研究也给出令人信服的证据,说明这一特征不只是特例,在一般情形下也存在。 最近,美国哥伦比亚大学社会学系的瓦茨教授领导的EMAIL试验也再次证明了这一人际关系世界中惊人的规律。然而,在现实世界中,六十亿人怎么可能真的构成如此紧密的相互关联呢?是互联网使一切成为现实。

2、 Xml
XML即可扩展标记语言(eXtensible Markup Language)。标记是指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等。如何定义这些标记,既可以选择国际通用的标记语言,比如HTML,也可以使用象XML这样由相关人士自由决定的标记语言,这就是语言的可扩展性。XML是从SGML中简化修改出来的。它主要用到的有XML、XSL和XPath等。

3、 AJAX
Ajax并不是一种技术。它实际上是几种已经在各自领域大行其道技术的强强结合。Ajax混合了:
* 基于XHTML/CSS
* 由DOM(Document Object Model)实现动态显示与交互
* 通过XML和XSLT进行数据交换及处理
* 使用JavaScript整合上述技术

直观一点的说Ajax能够实现不刷新浏览器窗口(当然更不用安装额外的插件)而满足用户的操作,现在一些看上去很Cool的网站,很多是用这项技术实现的,其中包括:orkut、Gmail、Google Group、Google Suggest、Google Maps、Flickr、A9.com等。2SIMPLE的Co-mment系统虽然没有用到XML/XSLT,其理念已经暗合容Ajax,实现了不刷新网页提供动态内给用户。

现有的产品:
Wiki百科、Wallop 、yahoo360 、openbc 、 cyworld 、43things 、 flickr、 del.icio.us、 cragslist 、glob 、客齐集、 friendster 、 linkin 、UU通 、 优友 、 天际网 、爱米网 、linkist 、新浪点点通、skype、亿友、cyworld

现在说说web2.0的具体应用。

历史很重要。对一个技术的学习也应当从历史出发,通过其在时间形成历史的流变,得以知晓现状,甚至能够预知未来。

那Web 1.0是什么呢?

他们说,记得静态HTML的WWW时代么?

(那个时代的WWW应用、人们的Web体验、对社会的影响如何?)

那么动态HTML和静态HTML下的Web相比,是多少版本?1.5?对了,他们是真这么叫的。

(在效果和影响上,与1.0相比,扩展和加深多少?)

要呈现的数据存储在数据库中,通过Web服务端的程序,应用户的请求,取出数据,加上事先设计的模板,动态的生成Html代码,发送到用户的浏览器那里。

他是1.0系列,应为用户在浏览器中所见和Web 1.0一样,它有0.5的升级,因为数据不是事先制作并发布,而是动态生成,和用户的需要交互生成。

那好,在加0.5,到Web 2.0,变化是在哪里呢?

(看到了正在崛起的和改变的,会继续朝着什么方向改变互联网和社会呢?)

更新:关于各个版本的差别,看看亚马逊的例子。

事情没有那么幸运,Web 2.0并不是一个具体的事物,而是一个阶段,是促成这个阶段的各种技术和相关的产品服务的一个称呼。所以,我们无法说,Web 2.0是什么,但是可以说,那些是Web 2.0。

WikiPedia的Web 2.0条目下列出了这些条件:

* CSS 和语义相关的 XHTML 标记
* AJAX 技术
* Syndication of data in RSS/ATOM
* Aggregation of RSS/ATOM data
* 简洁而有意义的 URLs
* 支持发布为 weblog
* RESTian (preferred) 或者 XML Webservice APIs
* 一些社会性网络元素

必须具备的要素有:

* 网站应该能够让用户把数据在网站系统内外倒腾。
* 用户在网站系统内拥有自己的数据
* 完全基于Web,所有的功能都能透过浏览器完成。

(以上内容引用自英文版维基百科)

虽然这只是一家之言,不过,对于其中谈到的几个要素,大家还是公认的。

- 基于RSS/ATOM/RDF/FOAF等XML数据的同步、聚合和迁移。

数据不再和页面和网站混粘在一起,它独立了,它跟着用户走。这是Web 2.0的很重要特征。这也是为什么Blog是Web 2.0的代表的原因。在网志上,常主角的是相互独立的一则则的网志。

独立,然后有物理表现。现在,就能让他们活跃起来。透过对XML数据的处理,这些内容能被自由的组合,被各种应用程序,不论是Web程序还是桌面程序等呈现和处理。

(更新:参看商业周刊的All Your Info in One Place)

当然,最重要的是背后的人。

- 社会性因素。

内容跟着人走,内容又能够被用户自由的组合,也就是说,用户能够自由的借助内容媒介,创建起一个个的社群,发生各种社会性的(网络)行为。

此外还有标签以及建立在开放标签系统之上的Folksonomy。

- 第三个公认的因素是开放API,这个技术性稍强些,得另花时间研习,可以先看看例子:amazon、flickr、google map等。

(Web 2.0是个大筐,装了好多东西)

从Web应用的产品/服务生产者角度来说,该如何创建Web 2.0的产品呢?

重要的是要抓住这么几点,一个是微内容(这里有定义),一个是用户个体。除了这两个最基本的之外,还可以考虑社群内的分享以及提供API。

微内容:英文是microcontent。用户所生产的任何数据都算是微内容,比如一则网志,评论,图片,收藏的书签,喜好的音乐列表、想要做的事情,想要去的地方、新的朋友等等。这些微内容,充斥着我们的生活、工作和学习,它的数量、重要性,还有我们对它的依赖,并不亚于那些道貌岸然、西装革履的正统文章、论文、书籍。

对微内容的重新发现和利用,是互联网所开创的平等、***、自由风气的自然衍生,也是互联网相关技术消减信息管理成本之后的一个成果。

我们每天都生产众多的微内容,也消费着同样多的微内容。对于Web 2.0来说,如何帮助用户管理、维护、存储、分享、转移微内容,就成了关键。

用户个体。对于Web 1.0的典型产品/服务来说,用户没有具体的面貌、个性,它只是一个模糊的群体的代名词而已。但是对于Web2.0的产品和服务来说,用户是个实实在在的人。Web 2.0所服务的,是具体的人,而不是一个如同幽灵般的概念。并且,这个人的具体性,会因为服务本身而不断地充实起来。

如何为这个具体的个体服务,是Web 2.0设计的起点。

因此,一类可以被称作Web 2.0的产品/服务将是这样:

服务于用户个体的微内容的收集、创建、发布、管理、分享、合作、维护等的平台。

这是表。

里呢,恐怕就设计到好些人提到的,微内容的XML表现;微内容的聚合;微内容的迁移;社会性关系的维护;界面的易用性等等。

其质,是否就是开源、参与、个人价值、草根、合作等等?

Web2.0是许多方面起头并进又相互牵连的一个新的阶段的到来。因此,不同的人,有着不同的看法。那么,对于Web开发人员来说,Web2.0意味着什么呢?

他们说Web2.0阶段,Web是一个平台,或者说,Web正在变得可编程,可以执行的Web应用。野心家们设想这个它的终极目标是Web OS。

Web 1.0时候,Web只是一个针对人的阅读的发布平台,Web由一个个的超文本链接而成。现在的趋势发生了变化,Web不仅仅是Html文档的天下,它成了交互的场所。

Web 2.0 Conference网站的横幅引用Jeff Bezos的话说“Web 1.0 is making the internet for people,web 2.0 is making the internet better for computers”。

具体来讲,他们说Web成为一个开发环境,借助Web服务提供的编程接口,网站成了软件构件。

这些,就是Web Service的目标吧,信息孤岛通过这些Web Service的对话,能够被自由构建成适合不同应用的建筑来。

一些例子:del.icio.us、flickr、a9、amazon、yahoo、google、msn等提供的编程接口衍生出的各种应用。

为什么要开放APIs,这涉及到集市中的商业方面的技术策略。当然,还有更深层的原因,那是什么呢?

这种交互不仅体现在不同的网站服务之间,同时还体现在用户和Web之间在浏览器上的交互。这也是为什么在美味书签的收藏中Web2.0和AJAX如此相关的一个原因。

在Web页面上使用桌面程序有的那些便利,真的是很享受的事情。这恐怕也是Web可编程的一个方面,Web页面不再是标记和内容混合那样的简单,它就是一个可以编程的地方(是这样理解吧?)

有人反对说,AJAX的使用对搜索引擎不友好,只有Web 1.0的站长才关心这个事情吧,在Web 2.0时候,站长应该关心的是用户参与的便利、用户的自由度,至于搜索,有RSS/ATOM/RDF等,更本用不着操心,Google不是已经顺应这个趋势,让大家主动提交了么?

可编程的第三个方面,是否在于Web应用和桌面应用之间的无缝连接趋势的出现?类似这里说的“从工具上,是由互联网浏览器向各类浏览器、rss阅读器等内容发展”

……

自己不是专业开发人员,对Web OS的学习就点到为止,下次换个方向,否则我非头大不可。

———————

cathayan和Live21说Web 2.0其实思路很古老,就是internet 1.0的回归。

Live21那里提到“关于概念的炒做应该不是一次两次的问题了”。

提到概念炒作,我还真见到过,今天在一篇报道中看到作为WEB 2.0的BSP的字眼,好笑得很。

不过,我真想说明,在目前中文Blog空间内能查阅到的学习、探讨Web 2.0的资料都不是炒作,因为包括我在内,大家都没有任何商业背景(注意,新闻报道中的那些Web 2.0除外)。

[Web 2.0是个历史学的概念,而非是个技术性的概念,它是对Web发展历史断代的成果。对这个概念的梳理,能帮助我更好的把握互联网正在发生的技术与文化。]

中文网志圈谈论的Web 2.0内容摘要:

- “我觉得最有价值的一个是, web应用的数据格式开始逐渐出现了交换“标准”…这些标准…更加容易被机器自动化处理…能帮助人更好地过滤和定制化信息。其次,更多的服务将以web service的形式来提供,…这使得web 服务可以被互相集成, 从而诞生更多新的服务…人的重要性被提高了。过去web更多注重在信息提供, 而现在的越来越多的应用更加关注人,也就是所谓“社会性”。此外web的可用性改进正在被越来越重视…”[老冒:朝web 2.0泼点冷水]

- “RSS逐渐成为在线内容提供服务的标准发行平台。Blog以及user-generated内容的兴起。My Yahoo提供的RSS整合型服务。同时提出了值得密切关注的一些发展中领域,其中包括搜索技术,个性化,User-Generated内容(包括 blog,评论,图像和声音),音乐,短视频和Accessibility(易访问性)”[Owen:Mary Meeker新作 - 关于Digital World的发展报告的摘取]

- “我们谈论的Web2.0带给我们的是一种可读写的网络,这种可读写的网络表现于用户是一种双通道的交流模式,也就是说网页与用户之间的互动关系由传统的“Push”模式演变成双向交流的“Two- Way Communication”的模式。而对于Web服务的开发者来说,Web2.0带来的理念是服务的亲和力,可操作性,用户体验以及可用性。”[Owen:BaCKpACK-体验可读写的Web服务]

- “web 2.0是一种可以被分发的信息概述,web文档被格式化成了web数据。我们不会再看到不同旧地信息,现在我们所注意到是一种聚合、再混合内容的工具。”[songzhen:也说Web 2.0的翻译]

- “从这些应用中可以看到:如果基于传统的HTML,同样的功能实现将变得非常复杂和不稳定,数据的再生产和交换成本是很高的。所以:RSS这个标准最终要的贡献就是使得互联网的大部分网站变得可编程:类似的例子还有Blog中的:TrackBack Ping等机制,这些机制都是依赖XML/RPC实现的。当初为Lucene设计一个RSS/XML的接口也是为了这个初衷,它使得全文检索服务可以轻松的嵌入到各种应用中,通过关键词将各种内容之间实现更丰富的关联(Well Referenced)。”[车东:RSS,简单协议使得互联网可编程]

- “聚合的可能性以及如何更好地聚合(通常来说,更好的聚合应该基于个人知识管理和人际关系管理)很显然应该成为新一代或者说web2.0架构的核心之一。还有,你会重新发现,恰好是分散带动了聚合,聚合促进了分散,通过聚合的思维,互联网的网络状变得越来越丰富和密集,web2.0就变得越来越有趣味,它将web1.0时代的硕大节点即门户网站不断消解,去努力创造一个更加和谐的自然网络图谱。”[Horse:rss,聚合的无数可能]

- “新的web2.0网站都依赖于用户参与、用户主导、用户建设”。[Horse:Web 2.0这个词]

- Keso:Web 1.0与Web 2.0的区别

- “表面上看,Bloglines取代了门户,成为一个新的中心,但这里有一个重大的区别。门户是只读的,它带有某种锁定的性质。你可以离开门户,但你无法带走门户的内容。Bloglines则完全不同,你觉得它好用,就会继续使用,有一天你不再喜欢Bloglines,你完全可以导出你的OPML,到另一个 RSS订阅网站,或者干脆用客户端软件浏览同样的内容。所以,像Bloglines这样的网站,是可写的,你可以导入,也可以导出。就像你对信息拥有选择权,对服务提供商也同样拥有选择权,没有人可以锁定你,主动权在你自己手上。”[Keso:再说信息选择权]

- “Flickr、del.icio.us、Bloglines等Web 2.0服务,通过开放API获得了很多有趣、有用的想法,并借助外部的力量,让用户获得了更好的体验。更多大公司也加入到开放API的潮流中,Google、Yahoo!、Amazon、Skype。Google桌面搜索今年3月才开放API,很快就产生了大量的创造,大大扩充了可搜索的文件格式。”[Keso:开放API]

- “归纳:web1.0天天谈门户,web2.0谈个人化;web1.0谈内容,web2.0谈应用;web1.0商业模式,web2.0谈服务;web1.0谈密闭、大而全,web2.0大家谈开放、谈联合;web1.0网站中心化,web2.0谈个人中心化;web1.0一对一,web2.0谈社会性网络;web1.0不知道你是狗,web2.0你去年夏天干了什么我一清二楚甚至想要干什么呢。。。”[van_wuchanghua:发现了N.HOOLYWOOD,我还知道你今年夏天要干什么]

- “我认为Web2.0有下面几个方面的特性: 个性化的传播方式. 读与写并存的表达方式. 社会化的联合方式.标准化的创作方式. 便捷化的体验方式.

Web2.0是以Flickr、43Things.com等网站为代表,以Blog、TAG、SNS、RSS、wiki等社会软件的应用为核心,依据六度分隔、xml、ajax等新理论和技术实现的互联网新一代模式。”

Blog——博客/网志:Blog的全名应该是Web log,后来缩写为Blog。Blog是一个易于使用的网站,您可以在其中迅速发布想法、与他人交流以及从事其他活动。所有这一切都是免费的。

RSS——站点摘要:RSS是站点用来和其他站点之间共享内容的一种简易方式(也叫聚合内容)的技术。最初源自浏览器“新闻频道”的技术,现在通常被用于新闻和其他按顺序排列的网站,例如Blog。

WIKI——百科全书:Wiki–一种多人协作的写作工具。Wiki站点可以有多人(甚至任何访问者)维护,每个人都可以发表自己的意见,或者对共同的主题进行扩展或者探讨。

Wiki指一种超文本系统。这种超文本系统支持面向社群的协作式写作,同时也包括一组支持这种写作的辅助工具。

网摘:“网摘”又名“网页书签”,起源于一家叫做Del.icio.us的美国网站自2003年开始提供的一项叫做“社会化书签”(Social Bookmarks)的网络服务,网友们称之为“美味书签”(Delicious在英文中的意思就是“美味的;有趣的”)。

SNS——社会网络:Social Network Sofwaret,社会性网络软件,依据六度理论,以认识朋友的朋友为基础,扩展自己的人脉。

P2P——对等联网:P2P是peer-to-peer的缩写,peer在英语里有“(地位、能力等)同等者”、“同事”和“伙伴”等意义。这样一来,P2P也就可以理解为“伙伴对伙伴”、“点对点”的意思,或称为对等联网。目前人们认为其在加强网络上人的交流、文件交换、分布计算等方面大有前途。

IM——即时通讯:即时通讯(Instant Messenger,简称IM)软件可以说是目前我国上网用户使用率最高的软件。聊天一直是网民们上网的主要活动之一,网上聊天的主要工具已经从初期的聊天室、论坛变为以MSN、QQ为代表的即时通讯软件。

RSS为Really Simple Syndication(简易供稿)的缩写,是某一站点用来和其它站点之间共享内容的一种简易方式,也叫聚合内容。网络用户可以在客户端借助于支持RSS的新闻聚合工具软件(例如SharpReader NewzCrawler、FeedDemon RSSReader),在不打开网站内容页面的情况下阅读支持RSS输出的网站内容。可见,网站提供RSS输出,有利于让用户发现网站内容的更新。在高速高质高效成为主流呼声的互联网时代,RSS无疑推动了网上信息的传播,提出了另一种看世界的方式。

RSS,原意是把网站内容如标题、链接、部分内文甚至全文转换为可延伸标示语言(XML:eXtensible Markup Language)的格式,以向其它网站供稿,使用者可以用一般的浏览器观看,也可以用特殊的“阅读器”软件来阅读。

历史很重要。对一个技术的学习也应当从历史出发,通过其在时间形成历史的流变,得以知晓现状,甚至能够预知未来。

那Web 1.0是什么呢?

他们说,记得静态HTML的WWW时代么?

(那个时代的WWW应用、人们的Web体验、对社会的影响如何?)

那么动态HTML和静态HTML下的Web相比,是多少版本?1.5?对了,他们是真这么叫的。

(在效果和影响上,与1.0相比,扩展和加深多少?)

要呈现的数据存储在数据库中,通过Web服务端的程序,应用户的请求,取出数据,加上事先设计的模板,动态的生成Html代码,发送到用户的浏览器那里。

他是1.0系列,应为用户在浏览器中所见和Web 1.0一样,它有0.5的升级,因为数据不是事先制作并发布,而是动态生成,和用户的需要交互生成。

那好,在加0.5,到Web 2.0,变化是在哪里呢?

(看到了正在崛起的和改变的,会继续朝着什么方向改变互联网和社会呢?)

更新:关于各个版本的差别,看看亚马逊的例子

事情没有那么幸运,Web 2.0并不是一个具体的事物,而是一个阶段,是促成这个阶段的各种技术和相关的产品服务的一个称呼。所以,我们无法说,Web 2.0是什么,但是可以说,那些是Web 2.0。

WikiPedia的Web 2.0条目下列出了这些条件:

* CSS 和语义相关的 XHTML 标记
* AJAX 技术
* Syndication of data in RSS/ATOM
* Aggregation of RSS/ATOM data
* 简洁而有意义的 URLs
* 支持发布为 weblog
* RESTian (preferred) 或者 XML Webservice APIs
* 一些社会性网络元素

必须具备的要素有:

* 网站应该能够让用户把数据在网站系统内外倒腾。
* 用户在网站系统内拥有自己的数据
* 完全基于Web,所有的功能都能透过浏览器完成。

(以上内容引用自英文版维基百科

虽然这只是一家之言,不过,对于其中谈到的几个要素,大家还是公认的。

- 基于RSS/ATOM/RDF/FOAF等XML数据的同步、聚合和迁移。

数据不再和页面和网站混粘在一起,它独立了,它跟着用户走。这是Web 2.0的很重要特征。这也是为什么Blog是Web 2.0的代表的原因。在网志上,常主角的是相互独立的一则则的网志。

独立,然后有物理表现。现在,就能让他们活跃起来。透过对XML数据的处理,这些内容能被自由的组合,被各种应用程序,不论是Web程序还是桌面程序等呈现和处理。

(更新:参看商业周刊的All Your Info in One Place

当然,最重要的是背后的人。

- 社会性因素。

内容跟着人走,内容又能够被用户自由的组合,也就是说,用户能够自由的借助内容媒介,创建起一个个的社群,发生各种社会性的(网络)行为。

此外还有标签以及建立在开放标签系统之上的Folksonomy。

- 第三个公认的因素是开放API,这个技术性稍强些,得另花时间研习,可以先看看例子:amazon、flickr、google map等。

(Web 2.0是个大筐,装了好多东西)

从Web应用的产品/服务生产者角度来说,该如何创建Web 2.0的产品呢?

重要的是要抓住这么几点,一个是微内容(这里有定义),一个是用户个体。除了这两个最基本的之外,还可以考虑社群内的分享以及提供API。

微内容:英文是microcontent。用户所生产的任何数据都算是微内容,比如一则网志,评论,图片,收藏的书签,喜好的音乐列表、想要做的事情,想要去的地方、新的朋友等等。这些微内容,充斥着我们的生活、工作和学习,它的数量、重要性,还有我们对它的依赖,并不亚于那些道貌岸然、西装革履的正统文章、论文、书籍。

对微内容的重新发现和利用,是互联网所开创的平等、民主、自由风气的自然衍生,也是互联网相关技术消减信息管理成本之后的一个成果。

我们每天都生产众多的微内容,也消费着同样多的微内容。对于Web 2.0来说,如何帮助用户管理、维护、存储、分享、转移微内容,就成了关键。

用户个体。对于Web 1.0的典型产品/服务来说,用户没有具体的面貌、个性,它只是一个模糊的群体的代名词而已。但是对于Web2.0的产品和服务来说,用户是个实实在在的人。Web 2.0所服务的,是具体的人,而不是一个如同幽灵般的概念。并且,这个人的具体性,会因为服务本身而不断地充实起来。

如何为这个具体的个体服务,是Web 2.0设计的起点。

因此,一类可以被称作Web 2.0的产品/服务将是这样:

服务于用户个体的微内容的收集、创建、发布、管理、分享、合作、维护等的平台。

这是表。

里呢,恐怕就设计到好些人提到的,微内容的XML表现;微内容的聚合;微内容的迁移;社会性关系的维护;界面的易用性等等。

其质,是否就是开源、参与、个人价值、草根、合作等等?

WEB标准不是某一个标准,而是一系列标准的集合。网页主要由三部分组成:结构(Structure)、表现(Presentation)和行为(Behavior)。对应的标准也分三方面:结构化标准语言主要包括XHTML和XML,表现标准语言主要包括CSS,行为标准主要包括对象模型(如W3C DOM)、ECMAScript等。这些标准大部分由W3C起草和发布,也有一些是其他标准组织制订的标准,比如ECMA(European Computer Manufacturers Association)的ECMAScript标准。我们来简单了解一下这些标准:

1.结构标准语言

(1)XML

XML是The Extensible Markup Language(可扩展标识语言)的简写。目前推荐遵循的是W3C于2000年10月6日发布的XML1.0,参考(www.w3.org/TR/2000/REC-XML-20001006)。和HTML一样,XML同样来源于SGML,但XML是一种能定义其他语言的语。XML最初设计的目的是弥补HTML的不足,以强大的扩展性满足网络信息发布的需要,后来逐渐用于网络数据的转换和描述。关于XML的好处和技术规范细节这里就不多说了,网上有很多资料,也有很多书籍可以参考。

(2)XHTML

XHTML是The Extensible HyperText Markup Language可扩展标识语言的缩写。目前推荐遵循的是W3C于2000年1月26日推荐XML1.0(参考http://www.w3.org/TR/xhtml1)。XML虽然数据转换能力强大,完全可以替代HTML,但面对成千上万已有的站点,直接采用XML还为时过早。因此,我们在HTML4.0的基础上,用XML的规则对其进行扩展,得到了XHTML。简单的说,建立XHTML的目的就是实现HTML向XML的过渡。

2. 表现标准语言

CSS是Cascading Style Sheets层叠样式表的缩写。目前推荐遵循的是W3C于1998年5月12日推荐CSS2(参考http://www.w3.org/TR/CSS2/)。W3C创建CSS标准的目的是以CSS取代HTML表格式布局、帧和其他表现的语言。纯CSS布局与结构式XHTML相结合能帮助设计师分离外观与结构,使站点的访问及维护更加容易。

3.行为标准

(1)DOM

DOM是Document Object Model文档对象模型的缩写。根据W3C DOM规范(http://www.w3.org/DOM/),DOM是一种与浏览器,平台,语言的接口,使得你可以访问页面其他的标准组件。简单理解,DOM解决了Netscaped的Javascript和Microsoft的Jscript之间的冲突,给予web设计师和开发者一个标准的方法,让他们来访问他们站点中的数据、脚本和表现层对像。

(2) ECMAScript

ECMAScript是ECMA(European Computer Manufacturers Association)制定的标准脚本语言(JAVAScript)。目前推荐遵循的是ECMAScript 262(http://www.ecma.ch/ecma1/STAND/ECMA-262.HTM)。