在Web 3.0时代,你不再为了预定一张机票,去好几个网站搜索航班和价格,进行反反复复的比较。你只需给你的软件代理设置一个任务,它就会想你所想,自动搜索并以最合适的价格订到你满意的航班。你还能查看你乘坐的所有航班的纪录:飞行了多少里程,目的地是哪里,行李发生过哪些问题等等。
这一切,并不是因为电脑变了,而是互联网变了。
语义网与在线操作系统的结合体
还记得过去的保龄球—保龄球1.0吗?你得在一张纸上写下所有人的名字,然后用铅笔在每个人的名字下写下他们的得分。后来我们进入保龄球2.0:往一个电脑屏幕里输入每个人的得分,电脑运算之后给出结果。今天的保龄球馆则更加聪明:自动换瓶机告诉电脑哪些木瓶还留在原地,计分软件就自动算出分数。这是不是有点Web 3.0的感觉?而真正的保龄球3.0是这样的:当你出现在保龄球馆,软件就能够认出你,并在你打球的时候自动计分,然后把当天的分数加到你的个人在线数据库—那里存有你所有的保龄球分数。你甚至能在同一天与不同城市的上万名打保龄球的人进行PK。
6年前,蒂姆·伯纳斯·李写道:“我盼望着网络能够分析所有的数据:内容、链接、人与电脑之间的交易。正在出现的语义网会让这些变成现实,当这些实现的时候,我们的日常生活会由机器之间的对话来处理。人们盼望多年的智能代理程序,最终成为现实。”
互联网之父这番颇让人费解的畅想,化成具体的场景就会是这样:
你在网上预订一个酒店房间,进去后你会发现,里面的床已经按照你喜欢的软硬程度设置好;洗澡水不冷也不烫,正是你喜欢的温度;电视屏幕上一边是你最爱看的电视节目表,另一边是你可能感兴趣的餐厅的名单;即使你已经昏迷不醒,也能在世界上任何一家医院得到治疗,因为他们都能立即进入你的医疗纪录。你能看到你驾车行驶的每一公里的记录、你拍摄的每张照片、你签署的每份协议……所有的这一切都在语义网上。
在2007年的今天,我们仍然把数据从一个应用程序搬到另一个应用程序。虽然你和同事的电脑上都有Word程序,但如果你要看同事的文档,他必须先发给你,然后你再用自己电脑上的Word来看这份文档。假如你的同事把文档做了修改之后又发给你,后来又做一些改动再发给你,相信你收到的文档版本已经全被弄乱了。怎么办?Google Docs和微软的Live文档以及Office 2007提供了Web 2.0的解决方法:你不需把文档发给任何人,只需给阅读和写作这些文档的人发送邀请,所有的编辑工作就会同时出现在你和对方的电脑屏幕上。
Web 3.0则更进一步—每个文件只有一个来源。你填过的所有表格:杂志订阅单、学校档案、驾照、合同、购物单、支票、银行表格等,都在你的在线数据保险箱里。如果你在个人ID里变更了自己的住址或者手机号,所有的在线文档都会自动更新为你的新住址和新手机号,你不需要向每个人都发一封邮件告诉他们你的住址变了、手机号换了。所有的东西都是相互链接的,没有复制的文件。这就是Web 3.0的伟大之处。
今天,笔记本电脑还因为便携性大受欢迎,几年之后,你将不再需要笔记本电脑。在Web 3.0时代,只用手握任何一个接入互联网的屏幕、登陆,你的个人桌面就会出现在你面前。你能通过手机的耳麦与你的在线桌面互动:听取你的留言、发送留言、听歌等,并且你的耳机能跟任何与它相通的设备无线连通。如果你的手机丢了,只需拿起别人的手机登陆自己的桌面。那时的手机没有任何内存,所有东西都从你的在线数据保险箱里获取。
乐高积木
如果你想买一辆山地自行车,你该去哪里?如果用Google搜索自行车,你会发现搜索结果里一大半是自行车协会、自行车爱好者的网站。想通过搜索关键词找到理想的自行车?几乎不可能。搜索为什么不能变得聪明点?
因为现在互联网上成千上万的产品信息都是用不同的语言和标准写的,有的是Excel文件,有的是Word文件、还有的PDF, 这些产品描述大概占到整个互联网(除去MySpace)内容的20%,彼此却并不认识,即使它们是相互重复的。因此,戴尔、亚马逊、eBay等网站便不得不建立自己的分类系统。不幸的是,这些分类系统之间并不互通。
要实现Web 3.0,核心是标准化的数据描述符,它们就如同我们小时候玩的乐高积木,可以相互拼接、任意组合,这样搜索就能聪明起来了。你只要输入对自行车的要求:车架、变速功能、轮胎、价格等等,然后就能在一张地图上看到所有符合要求的山地车,按照价格、车况或者任何你希望的方式排列。说不定你会发现邻居就有一辆自行车想出售,出门几分钟之内你就能搞定这件事。不管你是一个发动机厂的老板,还是一个拥有一套连环画的小孩,只要你把你的库存清单放在网上,搜索引擎就会自动把你和你的买家连接起来。
那么,这些乐高积木是如何搭建起Web 3.0的呢?在Web 3.0金字塔的最底层有一个“标准化产品描述符的数据库”。比如,你想买一辆汽车,在这个数据库里你就会看到来自制造商、杂志、保险公司等方方面面关于这款车的信息,这些数据都是标准格式的,因此你能按照任何标准对汽车进行比较:汽油消耗定额、维修记录、颜色、茶杯座的大小、撞击试验的等级等等,不一而足。底层还有另一个数据库,里面有每辆车的“数字出生证明”包含每辆车的所有相关信息。
金字塔的中间是“个人数据保险柜”,里面有你的个人ID和你拥有的一切东西的详细记录。比方说,财产指示器会链接到你的汽车的数字出生证明,以及你身为车主的纪录。
金字塔的顶端则是Ajax(异步的Javascript和XML处理)产品推荐器,它能让其他人在车主的许可下看到这辆车。比如,你可以把车放在eBay上,然后链接到你的个人数据保险箱里关于这辆车的文件夹,人们就能看到所有你愿意让他们看到的信息。如果你把车卖掉,这些信息就会转移到新的车主那里。
Web 3.0和现实的距离
其实,Web 3.0的元素在医疗领域目前已有应用。据调查,美国进行的所有医学测试中,有40%是因为不知道病人以前的测试结果而进行的。庆幸的是,在电子病历领域,现在出现了一个名叫“World Vista”的开源标准。这个由VA开发的基于Vista的标准向所有人开放,能够形成一个全球性的可互换医疗信息的系统。Thomas Goetz在《连线》杂志上发出赞叹:“由于使用‘Vista’,美国退役军人医疗系统的人均成本比十年前降低了32%。而同期的医疗消费价格指数增长了50%。”
今年5月,在美国圣何塞举办的2007年语义技术大会上,除了NASA(美国国家航空航天管理局)、美国国防部、美国空军、斯坦福大学等大型科研机构之外,微软、IBM、Oracle、Sun、Google、雅虎等巨头几乎倾巢出动,甚至波音、福特、沃尔玛这样的非IT企业也兴致盎然地前来参会,足见各界对Web 3.0的重视。微软MSN的高级副总裁布雷克·何文说:“Windows Live和Office Live是Web 3.0时代的领航产品,用户将可以定制自己的互联网内容世界。”Google也开始了对Web 3.0的精心布局,目前已经完成了从信息创作、信息组织、信息存贮、信息检索、信息发布、到信息翻译、再到信息服务、以及无线服务Google SMS 的一整条Web 3.0产业链的构建。
除了大公司的战略布局之外,Web 3.0在技术层面也有了新的发展。要实现语义网,其核心是要建造乐高积木—标准化的数据描述符。自1998年被W3C(万维网联盟)制定为标准以来,XML(可扩展标识语言)已成为互联网通用的数据描述语言标准,尤其是商业用户交换企业信息的通用方式,相比以前的HTML,XML具有清晰的结构以及强大、灵活的标签定义和数据描述机制,。但XML的缺点是只能描述数据的语法,而不能表达机器可理解的语义,无法满足语义网的要求。
因此,2004年W3C推出了一个基于XML的更为简单有效的数据描述框架—RDF(资源描述框架),在这个通用的框架下,所有的数据都能得到充分有效的描述,机器可以理解其表达的语义信息。RDF目前已被IBM、Adobe等公司应用到自己的产品系统中、波音的数据集成系统也采用RDF作为数据交互的中间语言,而中国的中医药科学数据中心也是基于RDF数据模型的,并在语义浏览方面领先国际。
但目前RDF数据并不普及,现有的Google和雅虎等搜索引擎会产生大量冗余或无意义的搜索结果,于是有人开始进行语义搜索方面的尝试,希望为用户提供相关度更高的搜索结果,StumbleUpon是其中的先行者。这个由三名加拿大软件工程师在2001年创办的搜索引擎结合了搜索算法和用户推荐,如果用户搜索“汽车”,网站将会综合考虑用户的收入、年龄、性别和家庭所在地等信息,提供一个网页列表以及其它有相似兴趣和背景的用户推荐的网站。该网站于今年5月被eBay以7500万美元的高价买走。
Phil Cogito是Cognition Search的CEO,他在这个还是测试版的搜索引擎首页上宣称他要“展示一种基于含义的搜索技术,让你进行前所未有的深度搜索”。该搜索引擎采用了一种独特的语言学和数学的混合算法,计算机“学会”了几乎所有的常用英语单词和短语,能理解词语在上下文中的含义。Phil 称,Cognition Search还具有“自然语言查询”的能力,不管用户输入怎样的问题,搜索引擎都能找到你需要的资料。美中不足的是,目前其搜索的范围仅限于案例研究、政府、医疗、政治博客等几个特定的领域。
不仅是文本,音乐也有了搜索引擎—Pandora.com,这家位于加州奥克兰的公司正通过一个名叫“音乐基因工程”的项目对音乐的音调、节奏和歌词等细节进行分析,用户输入歌曲或歌手名字,就可以听到这首歌曲。
在线操作系统(Web OS)也已经浮出水面。Ajax是打造友善、易于操作的用户界面最核心的技术,由于Web 2.0的助推,Ajax已经被发扬光大,Orkut、Gmail、Google Group、Google Suggest、Google Maps、Flickr、A9.com的界面都使用了Ajax。以Ajax为基础,国外已经有了Desktop On Demand、Ajax Windows、Eye OS等几家知名的Web OS,而在中国也诞生了自己的Web OS—TOMOS。登陆这家网站,你的眼前就出现了一个类似于Windows界面的在线操作系统,你能享受到“我的文档”、办公软件、多媒体服务、信息平台、IM聊天、娱乐游戏、邮件服务等多种服务。另外一家很有特色的网站YnnnY.com,是一个免费的个人在线记账平台,目前已有近两万人在这里记录下自己每天的生活开支。
很多关于Web 3.0的尝试已经出现,但这些尝试要聚合起来还需要一个漫长的过程,现在的Web 3.0就像一堆碎石,等待着被整理成一条畅通的公路。回想20年前,还没有Google,一套开放的标准和带宽让今天这个新世界成为可能。我们在今天描述Web 3.0,就如同当年在互联网诞生之前的世界里想象Web 1.0一样。