信 息 服 务 网 格

信 息 服 务 网 格
下一代互联网应用

(详细摘要)

李国杰

中国科学院计算所

 

一、互联网应用的瓶颈问题

我国互联网上网人数已超过5000万,光缆长度已铺了近200万公里。但中国电信投资25%在数据业务上而收入只占5%,我国已建网络开通用户率低于10%。这说明互联网的瓶颈不是带宽而是应用和市场开拓。

当前Internet应用存在的问题很多,包括遍地信息“孤岛”,信息“烟囱”林立;标准不统一,难以实现互操作;信息共享意识差,信息服务门槛高;信息资源建设低水平重复,有价值的信息少,信息垃圾多;找信息资源难,多资源协作更难;网络效益未充分体现;合理的信息安全体系尚未形成等等。

计算机的CPU周期(Cycle)已非常便宜。80年代:40万美元/MIPS90年代:250美元/MIPS,现在:2美元/MIPS。另一方面,网上资源的利用率极低。据美国NSF统计,Internet上每年产生的信息达2x1018 BYTE,每年Internet网上可利用的公用信息只有3x1012 BYTE,只占百万分之一。现在关键不是增加CPU Cycle,而是发展网格技术实现信息资源共享,提高信息资源利用率。

二、扩大互联网应用需要重视的几个问题

关于互联网应用有些问题已经讨论很充分,比如网络与信息安全、信息资源建设等。有些问题很重要,但尚未引起重视,这些问题包括通过互操作真正体现网络效应、以自治的原则构造互联网,重新考虑互联网的体系结构等。

1.     强调互操作性,体现网络效应

所谓网络效应是指互联网的效益正比于终端用户数的平方。要实现网络效应,必须做到当网络的规模扩大时,即新增加用户终端时,原有终端在不做任何升级改变条件下,其价值也随之提高。过去的电话系统体现了这种网络效应,而目前的互联网还做不到。

现在的计算机设备相互通信要依赖各式各样的驱动板卡,互操作性很差。为了提高互联网的网络效应,一定要把互操作性放在最重要的位置。消除信息孤岛,实现各种应用系统互连,关键也在互操作性。

2.     以自治的原则构造下一代互联网

实践证明,互联网不是事先“设计”规划出来的,而是动态演变出来的。我们需要统一标准和一定的宏观指导,但自治或自律(automomousautonomic)是互联网发展要求。

自治计算是网络应用的基本要求,包括:自组织—根据目标自动构造、支持自动地无缝集成新的部件;自维护---在负载和外部条件变化的条件下自动在线维护和调整;自优化---连续自动地抓住机会调整系统优化性能或降低成本;健壮性---在硬件软件出现故障时能自动检测与恢复。IBM CEO Sam Palmisano最近宣布:IBM将投入100亿美元经费用于网格计算的研究开发和市场开拓,称为on-demand computing,其核心技术就是自治计算。IBM采用集成技术已节约62亿美元成本。IBM宣称将从Putting information on the Web, e-business进入到integration阶段。

3.     重新考虑互联网体系结构

体系结构取决于应用。80年代初David Clark提出“End-to-End Argument”:“一种应用功能只有当其知识和帮助置于通信系统的边缘才能完全和正确地实现,因此将提出这种应用功能作为通信系统本身的性质是不可能的。”此论断的依据是:降低核心网络复杂性,便于升级;提高网络通用性和灵活性,增加新应用不必改变核心网络;提高可靠性等。20年后网络应用环境已大大改变。可信的服务、流媒体服务、ISP服务的多样化、政府监控等,这些变化使我们不得不重新考虑互联网的“边缘论”,Clark本人最近也提出这一问题。但我们不能走回头路用简单集中服务代替边缘论。End to End 原则所追求的灵活性和开放性应当保留。互联网既不能采用传统管理中常用的树形结构,也不能采用不分层次的纯扁平结构;即不能是纯粹的peer to peer,也不能完全是client/server结构。基于对网格的理解,互联网应当是一台巨大的计算机。

三、未来的互联网应用—网格(Grid

网格是一个正在发展中的概念,目前还没有严格的定义。归纳起来,国内外对于网格有以下几种看法:the infrastructure viewthe pervasive computing viewthe world-wide computer viewthe utility-computing viewthe integration viewThe Great Global Grid view,等。

我们认为,网格是互联网的下一波,网格的兴起为中国信息产业发展提供了难得的机遇。

经济和社会发展对网格有广泛的需求,例如制造业的“网络化虚拟制造”需求,金融界的“业务集中”需求,信息服务业的高性能、高质量需求,电子政务的“资源共享”和“协同工作”需求,能源业的高性能可视化计算、资源共享、系统监控需求,资源环境领域的海量数据处理和分析、共享、模拟与预测需求,科学研究和技术创新的需求及国防需求等等。

Web ServiceGrid已走向统一的OGSAIan Foster 最近在GGF上发表重要论文:The Physiology of the Grid, 提出OGSA(Open Grid Service Architecture)体系结构 ,New York Time介绍这一思想。OGSAWeb Service的自然演进,集成现有Web Service技术和OGSA的瞬时Stateful service instance技术, 很小的扩充将明显提高Web Service的功能。

网格不只是中间件。国内研究界有一种观点,认为网格是网络“中间件”技术,认为网格必须运行在各个服务器或客户机的“本地”操作系统之上。这种观点不能说错误的,但却是一种狭隘、甚至阻碍创新的观点。IBM(以及众多其它厂商和科研界)似乎是把网格操作系统(如WebSphere)构造在本地操作系统(如AIXLinux)之上,而微软则似乎在走OS/2的路,构造一个无缝的操作系统,既是网格操作系统,也是本地操作系统。随着网格的发展,操作系统、中间件与应用软件的界线将日益模糊。

网格是1995-2010年时段计算机体系结构、操作系统、用户界面领域最重要的突破性创新将为中国提供了一个前所未有的机会。就像IBM S/360对计算机系统领域所起到的突破性创新作用一样,网格也将是分布式系统的突破性创新。它正在产生通用分布式系统家族、标准的分布式系统体系结构、以及网格操作系统。与强调“分布”的传统分布式系统不一样,网格更强调将局域或广域的分布式系统看成一台虚拟的网格计算机。

网格技术提出的新概念包括:点播服务,及时集成,按需通信,信息拒绝,信息的强共享、次共享和弱共享,虚拟组织、虚拟用户、虚拟代理(Agent)等等。

网格研究提出了一系列原始创新问题,例如,如果整个因特网就是一台计算机,那么什么是它的硬件?什么是它的处理器、它的存储器、它的外部设备?它应该采用什么样的体系结构?什么是网格这台计算机的操作系统?什么是它的进程和线程?什么是它的地址空间?如何管理它的资源?什么是网格的编程环境和使用环境?什么是网格的用户界面?什么是网格的程序设计语言?什么是网格的应用?它们有什么样的模式和特征?从用户的角度看,网格与当前的因特网/Web有什么不同?它能提供什么样的独特益处?

四、我国正在进行的网格研究与示范应用

国家863计划网格专项(2002-2005)经费投入约3亿元(其中863投入1亿元),项目包括面向网格的超级服务器 (每秒4 万亿次),网格节点 (聚集性能约10万亿次),网格软件(网格OS,网格应用环境)和应用,网格应用项目包括:环境 (国土资源、森林、污染控制),加工业 (飞机、汽车),服务(天气预报),科学计算(生物信息学、新药发现、基础研究)等。

中科院计算所的网格研究-织女星(VEGA)项目。织女星(VEGA)网格具有以下几方面特色:Versatile Services, Enabling Intelligence, Global Uniformity, Autonomous ControlVEGA取自上述四个词组的头一字母。织女星网格的创新技术包括:网格浏览器与网格服务器、网格服务标识语言(GSML)、网格服务请求协议(GSRP)、网格资源路由器、基于角色与对象的访问控制、网格监控器、网格公共服务(用户管理)、网格数据挖掘工具(Vega-Miner)、网格文件系统(Vega-GFS)和网格资源高效定位与路由技术等。

计算所的VEGA网格系统正在郑州铁路局开发示范应用。我们的初步成果是设计了一套描述系统以及系统变更的规范,用以向平台中注册系统;为资源提供者设计了一套将资源绑定到特定的系统描述上并接入平台catalog的机制;为平台管理者设计了一套在资源集合之上建立关联关系对资源进行组织的机制;为power user提供了由资源、组织模式、操作、显示四元组构成的服务描述规范,用以透明地访问分布、异构资源。提供了一种变更类型扩展框架,并提供了一套根据变更描述实现服务自适应调整的机制。对用户的好处有:提供一个支持资源“热插拔”的工具,允许系统和具体数据提供者将自己的信息发布到网格上,并屏蔽编码不同的问题;允许网格管理员根据不同专业需求,按照不同方式组织资源社区,供使用;允许Power User通过选取资源自己定制信息服务,实现分布、异构信息透明访问;允许系统提供者描述系统的变更过程,并在一定程度上调整已有信息服务,实现自适应演进等。

另外,计算所还研制成功了支持远程数据共享、提供网格服务的蓝鲸1000网络存储系统,具有十分灵活的可扩展性和资源分配功能。按照国家863计划要求,计算所正在研制面向网格的超级服务器。

 

2003