国内外计算机技术进展
国内外计算机技术进展
---2002年回顾
中国计算机学会
衰退的经济、令人讨厌的丑闻和低迷的增长率使许多西方计算机界人士希望忘记2002年。但与国外形成鲜明对照,2002年是中国计算机界向CPU等核心技术发起冲击的一年。不论国内还是国外,计算机技术上都有相当大的进展,值得我们回顾。
一. 国外计算机技术进展
(一) 超级计算机
2002年3月日本NEC公司宣布研制成功世界上速度最快的超级计算机――地球模拟器,该机由5120个处理器组成,峰值速度每秒40.9万亿次,实际运算速度(Linpack标准测试)达到每秒35.86万亿次浮点运算(Teraflops),比排在第2名的IBM ASCI White超级计算机快5倍。日本超过美国占据超级计算机头把交椅,此事在美国科技界和政府官员中引起巨大振动,其影响不亚于1957年(前)苏联的第一颗人造卫星上天。由于军事和科研的需要,美国政府调整科技政策,加大对超级计算机的投入,美国能源部向IBM公司提供为期3年2.67亿美元的合同。CRAY、SUN等公司也承担了千万亿次计算机预研任务。IBM启动Blue Gene/L超级计算机研制,一共65536个节点,采用Power PC440GX处理器和Linux操作系统,峰值速度将达到每秒360万亿次,预计2004年完成。
NEC公司推出的地球模拟器也引起了计算机学术界的反思。近几年来,由于微处理器性能提高和广泛普及,为了提高性能价格比,大多数超级计算机都已采用基于通用微处理器的大规模并行或机群体系结构。地球模拟器没有随大流,仍然采用CRAY巨型机一样的向量机体系结构,因此造价高(约4亿美元),研制周期长(4年),但计算机的实际速度接近峰值速度。而大规模并行机在有些应用中效率不到10%。美国计算机界正在探讨究竟用什么样的体系结构才能有效地建造千万亿次(Petaflops)计算机。几年前美国启动过用超导技术研制Petaflops计算机的预研计划,目前普遍认为采用CMOS器件加上Processor in Memory (PIM)、大规模多线程等新技术有可能在2010年以前实现Petaflops超级计算机。除全球气候模拟外,蛋白质折叠计算等也是超级计算机的主要应用。
高端计算机的发展方向不仅仅是追求高性能。系统的瓶颈已从处理能力转向I/O特别是外部存储。因此网络存储系统成为增长迅速的行业,企业信息化的大部分投资都用在购买存储设备,网络存储正逐渐成为继PC和通信之后第三个IT亮点。
(二) 微处理器与SoC研制
微处理器的集成度与性能仍然按照Moore定律预测的速度发展。到2002年末,Intel P4处理器的主频已达到3.06GHz,Intel Itanium-2(1G主频)的SPEC CFP2000的测试值已达1422。2002年在芯片研制上最引人注目的是IBM投资4亿美元与日本SONY等公司合作开发PS-3游戏机用的Cell芯片。该芯片设计主频4GHz,片内含64个处理单元。除MPU外,片内还包含主存和宽带网络控单元以及高速图形加速器,预计单片性能高达每秒一万亿次浮点运算(Teraflops)。IBM投资30亿美元建设Cell芯片加工厂,计划2004年投产。
系统芯片(System on Chip,SoC)是芯片发展的新方向,其产业增长速度超过CPU和存储器一倍以上。由于SoC芯片既要有针对某种应用的高性能又要有一定的灵活性,因此可逻辑综合和可重构的SoC成为业界关注的热点。2002年Tensilica公司的Xtensa V可重构处理器在嵌入式处理器性能标准测试(EEMBX)中取得最好成绩。MIT的RAW研究组在可重构芯片方面做出了更大胆的创新,一颗RAW芯片中装有16个相同的处理单元,采用三种片内网络将这些处理单元很规则地连结起来,通过程序改变互连,就能实现不同的功能。这种设计方案具有很好地可扩展性,将来可能在一块芯片中安放上千个处理单元。
(三) 网格(Grid)计算
网格研究是2002年的一大热点。网格研究地动机是希望计算机硬件、软件资源像水和电一样为人们共享,使连在Internet上的计算资源变成一台巨大无比的虚拟计算机。美国与欧洲已建立了几个不同领域的科学计算网格。IBM等大企业也在积极推行与网格技术类似的Web Service,更侧重于信息服务。2002年有两件大事使网格技术更加受人重视。第一件是2月份在加拿大召开的网格论坛大会上公布Open Grid System Architecture,即OGSA标准,使Web Service融入网格技术,XML、SOAP、WSDL和VDDI等协议也作为OGSA的基础,但OGSA的协议增强了对动态资源的管理。OGSA标准的提出使更多企业加入推广网格技术的行列。第二件事是美国NSF提出了推动网格建设的Cyberinfrastructure计划,每年增加6.5亿美元投资用于网格基础设施建设。NSF的重视使网格研究进一步升温。
IBM是网格技术的积极推动者,2002年IBM制定了“百亿美元网格计划”,打造全球计算平台,重点发展资源共享、自治管理、互连互通、应用服务四项关键技术。随着计算机性能提高和成本降低,计算机性能已不是用户关注的主要指标,可管理性和可维护性成为人们关心重点。IBM的eliza计划旨在发展计算机自我修复功能,远程侦测并修复计算机出现的各种故障,自治管理也是网格技术的重要内容之一。
(四) 开放源码软件
由于微软公司对桌面操作系统和办公软件的垄断,广大用户包括政府部门都感到支付软件费用是沉重负担。近几年以Linux操作系统为代表的开放源码软件蓬勃发展,Linux在服务器领域已占有25%以上的市场份额,其增长速度远远超过其他操作系统。2002年全球许多国家的政府都呼吁在公共机构使用开放源代码软件。 法国政府通过立法公开宣布支持开放源码软件,美国国防部也通过发表调查报告的形式表示支持开发源码。英国、挪威等国政府已经开始将Linux等开放源代码软件作为一种躲避微软高昂的许可费的途径。欧盟建议所有成员国应当通过共享开放源代码软件,建立可利用利用资源库。中国大陆、香港特别行政区、菲律宾的政府机构已经开始使用Linux。大部分的政府网站都运行开放源代码的Apache互联网服务器软件,华尔街的许多金融公司也使用基于Linux的系统。政府部门的公开支持给开放源码再添一把火。
但是,开放源码的发展与传统的软件厂商有利益冲突,2002年关于Linux操作系统的安全性能是否不如传统操作系统的一场大争论也反映了对开放源码的两种不同态度。但总的来讲,开放源码是大势所趋,支持者会越来越多。开放源码本身也会越来越完善。
(五) 量子计算机与DNA计算机
量子计算、量子通信与量子密码是信息技术发展的前沿领域。2002年12月20日美国IBM公司宣布该公司的Almaden实验室成功进行了迄今为止最复杂的量子计算:将合数15分解成因子3和5。具体试验过程是将5个氟原子和2个炭原子合成为7个原子核的新分子,通过高频脉冲使之成为可编程量子位,即构成7个量子位(qubit)的量子计算机。IBM科学家控制1018个这样的分子进行Shor算法,结果完成了上述因子分解运算。真正走向实际应用的量子计算机可能要几万个量子位以上,从7位到几万位还有相当长的路要走,因为至今科学家还没有找到如何扩展量子位的途径。相对而言,量子通信技术可能会更早实用化,2002年已经成功实现87公里量子通信实验。但量子计算机的许多奇妙特性(如巨大无比的并行性)吸引了众多学者,获得图灵奖的唯一华裔计算机科学家、普林斯顿大学姚期智教授就是其中佼佼者之一,2002年10月他来华访问,专门做了关于量子计算机的报告。
与量子计算机一样,生物计算机也是新的交叉学科方向。2002年生物计算机方面最突出的进展是DNA计算机求解了一个包含20个逻辑变量的可满足问题(SAT)。SAT问题是最经典的NP完全问题,20个变量的SAT问题有220即100万种以上的可能解,要从这百万种以上的变量的真假值组合中找到一种赋值使所有的子句都为真(Adleman的实验中有24个子句,每个子句3个变量)。这一问题的难度远远超过他过去解决的7城市旅行推销员问题,这是迄今人类用非传统计算机解决的最复杂的问题。DNA计算机成功求解SAT问题使人们对生物计算机的前景更有信心。2002年DNA计算机的另一项重大进展是奥林巴斯光学公司与日本东京大学合作联合研制成功一台有商业化可能的DNA计算机,该DNA计算机由分子计算和电子计算两个部件组成。前者计算分子的DNA组合,实现化学反应,筛选出正确的DNA结果,后者则对这些结果进行分析。这种集成方案使人们看到了DNA投入实际应用的曙光。
二. 国内计算机技术进展
(一)CPU和SoC研制
众所周知,我国信息领域的核心技术如CPU芯片、操作系统长期控制在Intel、微软等外国公司手里。从本世纪初开始,我国开始向CPU等核心技术进军,经过两年努力已取得一些初步成果。中国科学院计算所于2002年8月研制成功我国第一款有自主知识产权的通用CPU――龙芯1号CPU芯片。"龙芯"1号CPU芯片用0.18微米CMOS工艺实现,定点字长32位,浮点字长64位,流水线结构先进、效率高,主频可达266MHz,实测定点与双精度浮点运算速度均超过每秒2亿次。"龙芯"1号具有自主知识产权,在设计中申请了十多项专利。"龙芯"1号样机的实测性能和采用MIPS R5000 的SGI O2工作站性能相当,性能达到国外90年代中后期通用CPU水平。该芯片运行稳定可靠,通过了SPEC2000基准程序测试和产品测试,可商品化生产。"龙芯"1号具有防缓冲区攻击的硬件设计,可以抵御一大类黑客和病毒攻击,适合做安全的网络服务器。"龙芯"1号功耗低,实际运行功耗小于0.5瓦。该芯片与MIPS CPU兼容,支持Linux、VxWorks等主流操作系统,能直接支持软解压的流媒体应用,可用于网络终端机(NC)、工业控制计算机等嵌入式设备。
龙芯1号推出后不到三个月, 海尔、长城、龙芯、中软、中科红旗六家企业与中科院计算所就成立了龙芯产业联盟,共同推进以龙芯CPU为基础的信息产业。2002年我国不但实现了通用CPU从无到有的历史性突破,而且实现了微处理器和系统芯片(SoC)的群体性突破。除龙芯CPU外,中芯微系统公司于12月中旬推出方舟2号32位嵌入式SoC,性能比前一年推出的方舟1号有明显提高。12月底北京大学也推出了众志系列32位嵌入式系统芯片。这些系统芯片有望在网络终端计算机等嵌入式应用市场上占有一席之地。2002年中星微电子公司也推出了图象处理领域的升级芯片并打进了国际市场。峰值速度每秒20亿次运算的龙芯2号CPU预计2004年初可研制成功,再经过几年努力,我国在CPU设计核心技术上有望达到国际先进水平。
编译技术是与CPU密切相关的技术,一个好的优化编译系统可以成倍地提高CPU的性能。2002年中科院计算所与Intel公司合作完成了基于Linux的Intel Itanium-2 64位微处理器开放源码优化编译系统,其性能接近Intel的商品级编译器,鲁棒性和灵活性也很好,居世界领先水平。这是中国科学院首次在计算机核心技术领域与国外公司合作并取得成功。
(二)高性能计算机
曙光3000研制成功以后,曙光公司基于曙光3000的技术开发成功曙光1700超级服务器,2002年曙光1700在市场上取得巨大成功。在气象、石油、高校等领域累计推广了近1000套曙光1700超级服务器。曙光3000超级服务器本身也在科研工作中发挥了巨大的在作用,其中影响最大是华大基因中心将曙光3000用于水稻基因组测试。4月5日出版的国际权威期刊《科学》以专题报道的形式发布《水稻(籼稻)基因组的工作框架序列图》及其它相关研究进展。中国科学院和《科学》杂志社等有关方面4月4日联合在京发布了这一消息。
2002年8月,联想集团宣布研制成功深腾1800机群系统,该系统包含20个机柜、256个计算功能结点机、526个Intel至强处理器,内存总容量为272GB,系统总硬盘空间为6TB,实测性能达到每秒1.027万亿次浮点运算。按照2002年6月公布的全球高性能计算机TOP500排行榜,深腾1800可排在第24位。继曙光公司之后,我国IT产业的龙头企业---联想集团开始涉足高性能计算机领域,这将有力地促进我国高性能计算机产业的发展。
(三)有科学价值的计算机应用
我国计算机应用取得了很多成果,本文只介绍其中两个有科学价值的应用成果。
我国第一个大型地质图基础空间数据库—全国1∶20万数字地质图空间数据库,历经国土资源部等有关单位8年的努力终于建成,从2002年9月11日开始,地质调查、矿产资源评价、地质灾害预警等相关部门能够使用数字化的1∶20万地质图。1∶20万数字地质图空间数据库基于我国唯一的、实测的、全国性的1∶20万区域地质调查结果,包含了1163幅1∶20万地质图数据,覆盖了整个国土范围的72%,总数据量达到了90GB,是目前我国规模空前的数字地质调查产品。数据库的建成将为国家和省级各部门进行区域规划、地质灾害监测、地质调查、找矿勘查、宏观决策等提供信息服务。此外,由中科院遥感应用所牵头,建立了覆盖全国的遥感影像数据库,恢复了我国20世纪80年代中后期的土地利用空间数据库,制图精度为十万分之一。该数据库为进一步开展国土资源环境动态监测与科学研究奠定了坚定的技术和数据基础。
由中国科学院、首都医科大学、和解放军第一军医大学等单位协作攻关,2002年6月底成功采集到了首组“数字化虚拟中国人”数据,在数字化虚拟人研究领域取得重大突破。“数字化虚拟人”是“虚拟可视人”、“虚拟物理人”和“虚拟生物人”的统称,其原理是通过先进的信息技术与生物技术相结合的方式,在计算机上操作可视的模型,包括人体的各器官和细胞等,最终建成生物网络化的流程,即从几何图型的数字化“可视人”到真切实感的数字化“物理人”,再到随心所欲的数字化“生物人”。目前,全世界只有美国、韩国掌握了“虚拟可视人”技术。国家“863”计划专家组实地验收认为,与美国“虚拟人创新计划”、韩国“可视韩国人计划”相比较,我国的虚拟可视人从仪器设备先进程度、技术方法设计创新,到铣削扫描精度定位,均有突破和进步,其技术水平已达到国际先进水平。
(四)算法研究
算法和计算复杂性是计算机科学的核心。国内有一批学者为寻求NP困难问题(计算时间随问题规模按指数函数增长的一类难解问题)的有效算法(包括近似算法)付出了艰苦努力。高性能算法973项目在集成电路设计、电力调度、交通、证券和信息查询等多个领域,提出一批既有世界先进水平又有较高实用价值的高性能算法,其研究成果正在一些重点工程领域推广应用。 2002年的TREC(Text Retrieval Conference,文本信息检索国际会议)上传来佳讯,在TREC组织的文本信息检索比赛中,清华大学和中科院计算所共取得了3个项目的第一名!一些著名的大学和公司,如卡耐基梅隆大学、加州大学伯克利分校、IBM公司、微软剑桥研究院等,均参加了比赛。这一优异成绩充分显示了我国从事973计划高性能算法项目科研人员在算法研究上的实力。
中科院计算所先后投入约400人年的科研力量,历时六年,在数字视频广播关键技术上取得了全面的突破性进展。该研究组提出的"快速鲁棒的静态Sprite生成算法"被国际MPEG-4标准采纳,2002年7月该研究组提出的"结合率失真优化理论的码率控制算法又被国际JVT(Joint Video Team)标准接受。在此基础上国家信息产业部成立了音视频编解码标准工作组,正在制订我国下一代音视频编解码标准。
(五)智能人机接口
汉字识别是我国发展计算机技术的一个特色。汉王公司联机手写汉字识别系统,采用多种方法和综合集成技术,可混合识别繁体、简体、香港字及常用导体字达2.1万字。正楷识别率达98%,连笔识别率达95%。汉五笔8.8版,无论从操作界面上,还是从系统识别率上都达到了一个新的境界和新的水平。在技术上处于国际领先水平,完全达到实用化程度。目前,汉王产品市场占有率在70%以上,取得比较好的经济效益和社会效益。另外,中科院自动化所在语音识别方面也取得了突破性进展,其识别性能优于国际跨国公司公开发表的结果,并申请了8项国家发明专利。另外,中科院计算所在中国手语识别方面首次研究了大词汇表(达1000以上的汉语词汇)的手语识别问题,正确识别率达92%-95%。在手语合成方面,利用虚拟人合成技术合成了3163个基本中国手语词汇的手势,在全世界首次实现正常人与聋哑人的实时交流系统。
执笔人:李国杰,中国工程院院士 2002年