非传统的高性能计算技术

非传统的高性能计算技术

 

国家智能计算机研究开发中心

李国杰

 

众所周知,20世纪下半叶电子计算机蓬勃发展的主要基础是基于硅材料的微电子器件。目前0.18μm微电子工艺技术已基本过关,到2010年前后,微电子工艺将突破0.1μm,进入亚0.1μm技术时代。当集成电路的线宽小于0.1μm以后,来自器件工作原理、工艺技术与制造成本等方面的限制将形成难以克服的障碍,许多人把这种障碍称为微电子技术的“极限”。其实,这种工艺和成本上的“极限”是一种挑战,0.1μm不是硅集成电路理论上的极限。微电子技术理论上的极限来自光传输速度、量子力学的测不准原理和热力学第二定律,开发亚0.1μm硅微电子技术还要走很长的路才会遇到真正理论上的极限,也许微电子时代以后会出现以纳米电子器件为基础的“纳电子”时代。如果我们把以微处理器为基础的电子计算机称为传统计算机,本文将讨论非传统的高性能计算机的发展方向。

发展高性能计算有两条途径,一条是基于现有的半导体集成电路技术,即微处理机技术,通过提高并行处理能力来实现;另一条途径是突破硅半导体器件框框,发展非传统的新技术,包括超导计算、量子计算、生物计算与光计算等。再过1020年,上述新技术可能走向实用。

提高计算性能可以从两个不同方向入手,即自底向上或自顶向下,前者致力于研制超高性能器件或部件,如量子器件、超导芯片、光互连和光存储部件、生物分子部件等,主要在硬件方面下功夫。后者致力于计算模型和算法设计,从根本上突破冯·诺依曼计算机与电子技术的局限,比如量子计算和DNA计算模型都为求解复杂问题开辟了崭新的思路。我们在开展高性能计算基础研究时,这两个方向都应考虑。在我国投资有限的条件下,也许计算模型与算法方面更有可能获得突破性的创新进展。

美国开展一千万亿次(Petaflops)计算机研制之初,曾对上述各种新奇的技术做过仔细分析和评估,最后的结论是在2010年以前除了利用硅半导体器件以外只有超导计算机有可能造出一千万亿次计算机,因此将主要经费投入传统大规模并行机,另外也拨了一部分经费支持研制以超导技术为主的非传统高性能计算机。其实,早在60年代末期,IBM公司就已开展超导器件研制,80年代日本MITI也研制过超导器件,但是由于没有突破半导体电路的设计思路,仍采用电压高低表示10,用门闩电路作开关,这种超导器件时钟频率只能达到几个GHz,与半导体电路相比,没有质的飞跃,因此超导数字电路的研究一度跌入低谷。86年高温超导的发现,特别是1985年俄罗斯学者Likharev等人提出的快单磁量子(RSFQRapid Single-Flux-Quantum)技术,利用穿过超导环的磁通量具有量子特征的原理设计逻辑电路,以磁通量表示数字信息,使得基于RSFQ技术的逻辑电路的时钟频率可达到几百GHz,而功耗只有0.3μw/门,彻底改变了超导数字电路的命运。现在几乎没有人怀疑超导器件将在超高速数字器件市场取得成功。比半导体电路主频高两个数量级只是超导电路的一个优点,另一个重要优点是功耗低,基于RSFQ技术的Petaflops计算机总功耗只有10Kw左右(已考虑液态氦45°K所需的制冷功耗),而采用半导体电路功耗高达30Mw。超导集成电路工艺比半导体集成电路简单,95年在实验室中已用1.5μm工艺研制出370GHzRSFQ铌超导电路。但是目前集成度只能做到万个约瑟夫森结水平。

美国纽约州立大学石溪分校等几所大学正在联合研制超导计算机,采用铌材料,0.8μm的约瑟夫森结技术,芯片大小2×2cm2,每片约300K门,即310M约瑟夫森结。正在研制的超导计算机主频为100GHz,一个功能单元每30ps产生一个浮点结果(320亿次),一个处理机含8个功能单元,具有256Gflops计算机能力。如果采用4096个处理机,可以达到千万亿次水平。在这一研制计划中,RSFQ技术不仅用于计算逻辑器件,也用于芯片内高速缓存。尽管实现Petaflops计划还要攻克许多学科的技术难关,但研制者们对下世纪初推出千亿次水平的超导工作站信心十足。

目前信息技术的特征是以电子为主要信息载体,因此常称为电子信息技术。由于光子的速度比电子速度快,光的频率比无线电频率高很多,信息载体由电子转向光子是一种必然发展趋势。1970年在第九届国际高速摄影会议上提出了“光子学(Photonics)是以光子作为信息载体的一门系统性科学”,国外一些学者认为“通信与计算机研究与发展的未来属于光子学领域”。研制高效率低功耗的光子器件是实现光计算的关键,高密度垂直腔面发射激光器(VCSEL)的光子集成回路是二维光信息实时处理的重要器件。光数字计算中发展较快的是基于余数计算理论的MSD技术。但是从目前掌握的光计算技术来预测,光子技术近1520年内不大可能为Petaflops量级的高性能计算机提供高速度、高密度、低延迟的逻辑电路。光计算的最大特点是大规模并行,所以光计算在图象处理、神经网络计算方面有优势。光计算要走向实用还需解决可靠性、容错、功耗、封装密度,光电连接等许多关键技术问题。

光子技术在存储和通信方面有电子技术无法比拟的优势。数字光盘存储技术正朝着更高存储密度和更高存取速度方向发展,目前的热记录方式将变为光子记录方式。近场光学扫描显微镜(NSOM)和扫描探针显微镜(SPM)可进行超高密度的信息存储,北京大学等单位合作研究有机复合薄膜的光学存储特性,达到1012 bit/cm2的超高存储密度。三维全息存储可能会成为下世纪最主要外存储技术,带宽可达100Gbps,存储密度可达1TB/cm3。光互连技术已经被当前的高性能计算机所采用。光电转换技术近两年有重大突破,已可以采用标准的IC封装。灵巧象素器件将光子器件、光学器件和电子器件集成在一起,发挥互补优势,这是值得重视的光互连技术。波分复用技术在计算机互连中将发挥重要作用。利用波长区分目标地址,采用波分复用技术中实现路由寻址功能,这可能是光互连的又一个重要方向。

量子计算与生物计算过去几年内有些重大进展表现在计算模型和算法设计上,1994年同时在这两个领域取得一些突破。AT&TPeter Shor设计了一种量子计算算法,求解因数分解问题所需的时间正比于被分解数位数的平方。这可能是求解在传统计算模型下具有指数复杂性的困难问题的历史性的突破。也是在1994年,采用分布在全世界的1600台工作站花了8个月时间(利用机器空闲时间)成功地分解了一个129位数,此事引起巨大轰动。如果仍用这1600台工作站试图分解一个1000位的大数,其计算时间将大大超过宇宙的年龄。而用Shor的量子算法,只须几百万步计算,这是多么了不起的突破!量子计算能做到这一点主要得益于量子迭加(Superposition)效应,即一个原子的状态可以同时是10,更确切地说,原子可处于01的几率各为1/2的迭加态。采用L个量子位(qubits)可以一次同时对2L个数进行处理,一步计算完成了电子计算机2L个数计算。从这个例子可以看出问题的描述方法对降低计算复杂性起决定作用,这就是研究计算模型的魅力。

量子计算涉及计算的本质,基于计算的物理模型。从某种意义上讲,量子计算是把计算机科学当成物理学的一个分支,同时也把一部分实验物理学当成计算机科学的一个分支。从理论上讲,量子计算机等价于可逆的图灵机。量子计算将基于量子物理学研究发现的一些近乎神奇的性质:信息传输可以不需要时间(超距作用),信息处理所需能量可以接近于零。19977月第277Science期刊报道,日内瓦大学的Gisin小组用实验证实了相距10.9公里的缠绕光子对之间难以置信的超距作用。光子缠绕态和原子缠绕态可以进行量子超距传输这一发现会不会对计算机与通信产生不可估量的革命性影响,现在还难以评价,但这种神奇的特性一定会吸引许多科学工作者投入量子计算的研究。

近年来,基于量子力学效应(如量子相干、量子隧穿、库仑阻塞效应等)的固态纳米电子器件研究也取得较大进展,这些纳米器件包括量子点器件、共振隧穿器件以及单电子器件。将共振隧穿二极管制作在微米级的MOS电路上,构成混合量子效应/体效应器件,可将目前的数字逻辑电路集成度提高几百倍。固态量子器件多采用Ⅲ-Ⅴ族化合物半导体材料,但近年来高质量GeSi/Si材料研制成功为发展硅基固态纳米器件提供了很好的机遇。今后几年内各种量子逻辑器件将问世,但要真正实现量子计算机,距离还较遥远。量子计算机的难点在如何连接这些器件,因为量子计算是一种可逆计算,必须在保证周围环境不干扰其计算过程的条件下进行。这种特征对量子密码和传输有特殊意义,但大大增加了制造量子计算机的难度。

生物系统的信息处理过程是基于分子的计算与通信过程,因此生物计算也常称为生物分子计算。生物计算不是按照确定的算法求解问题,而是通过竞争优化的方式求解问题,其计算的主要形式是学习与记忆,因此生物计算中信息处理和存储密切相关。生物分子计算的主要特点是极大规模并行及分布式存储。基于分子构象相互作用的分子模式识别是生物系统信息处理的基础,基于这一认识,Conrad80年代就提出了自组织的分子器件模型,通过大量生物分子的识别与自组织可以解决宏观的模式识别与判定问题。近两年受人关注的DNA计算也是基于这一思路。DNA分子是由四种核苷酸(碱基)连结成的高分子链,四种碱基分别记为AGCT,我们可以把DNA计算看成每一“位”可取四种不同值之一的四值逻辑运算。如果用不同的DNA单链短片段分别表示有向图中的结点和弧,通过互补碱基的匹配结合(AT互补,CG互补),就能生成DNA双链长片段,表示有向图中一条路径。因此,通过大量DNA分子的混合、合成、分离、检测、提取等操作,就可以求解在图上寻找路径等判定问题。

美国南加州大学的Adleman 教授9411月在Science期刊上发表了一篇具有里程碑意义的论文,他设计了一个DNA计算算法,用了7天时间,在试管内做DNA分子合并分离,成功地找出7个城市的一个哈密顿圈,即每个城市访问一次的回路,并声称用生物学方法可以在线性时间内求解哈密顿圈问题。96年普林斯顿大学的Lipton教授又将DNA计算应用于求解最基本的NP问题-SAT问题,显示了DNA计算在求解组合判定问题的明显优势。笔者认为,Adleman的工作开辟了生物计算的一个重要方向,但从计算理论上看还未实现根本性的突破。因为目前采用的DNA计算模型基本上是采用以空间换时间的思路,充分利用分子数量多(一升DNA溶液包含1017DNA分子)这一特点,以极大规模的并行来加速组合计算。这种蛮干的办法仍然对付不了指数性的组合爆炸,或许地球全部DNA分子都用上,也解决不了1万个城市的哈密顿圈问题。迄今提出的DNA计算模型较适合做组合判定问题,直接进行加减乘除计算还不方便。电子计算机的蓬勃发展基于图灵机的坚实基础,同样,生物计算机要成为一种通用计算机,必须先建立与图灵机类似的计算模型。除了DNA计算外,生物计算还有另一个发展方向,即在传统的半导体芯片上加入生物分子部件,将硅基与碳基结合起来的混合技术。以生物分子为基础的生物存储器也是一个重要研究领域。

超导、光子、量子与生物计算是实现高性能计算的新途径,在21世纪内,这些新技术可能导致一场新的技术革命,我们必须从现在起就要开始投入力量,从基础研究做起,根据有所为有所不为的原则,有重点的抓好几项前沿研究,不要重蹈我们在微电子技术上长期落后的覆辙。但是,这些新技术的成熟还有个过程,不能以一些不太负责任的新闻做为我们决策的依据。98225日《中国科学报》在报导美国HP公司在研制一种量子计算装置时,下了一个结论“2010年硅芯片微处理器将不再采用”,这种结论过于武断,不能认为是一种科学的预测。

电子计算仍有强大的生命力,至少近半个世纪内,其他计算技术不大可能完全取代电子计算机。我们不应强调研制纯而又纯的超导、量子、光学和生物计算机,而应发挥各自的长处,在优势互补、系统集成上多下功夫。事实上,各种混合技术,如光电技术、超导-电子混合技术,光学生物混合技术等都取得了较大进展。制冷技术虽然不属于计算机技术,但对于超导计算机而言,制冷的功耗也是必须重视的关键问题。美国Petaflops计划中设立的HTMT项目(混合技术多线程体系结构)是一个典型的多种技术综合集成项目,包括100GHzRSFQ技术、200Gbps的光通信技术,延迟为20ns的数据涡流技术,TB/cm3的光学全息存储技术,PIM(Processor in Memory)技术、高速接口技术、多级多线程执行模型及处理器内单时钟周期线程切换技术等。特别要指出的是CPU速度的大幅度提高(100GHz主频)造成CPU速度与存储器速度(取决于电子在导线上的传输速度)之间巨大间隙,必须通过编译等系统软件技术来解决数据的局部性问题,提高系统的实际效率。在一个相当长时间内,提高实际速度的一部分担子只能压在用户身上。既达到极高速度又非常容易使用(编程时间少)是我们追求的目标,但实现两全其美还有个过程,我们必须锲而不舍地朝着智能化高性能计算机的方向努力。

 

1998