高性能计算机与数理基础研究的互动

高性能计算机与数理基础研究的互动

李国杰

报告摘要

 

有效地求解一个复杂的问题,无论是科学问题、工程问题还是社会经济问题,一般都需要三方面的共同努力。首先是对问题本身的深入理解,即问题领域的专业知识,其中也包括数学模型与数学工具,对采用数学工具不易求解的问题可能要用到人工智能技术。只有对求解问题和专业知识有深刻的理解,才能对并行计算机特别是专用并行计算机体系结构提出有创意的需求。日本研制成功用于计算多体引力的Grape-6专用并行计算机就是天体物理学家参与高端计算机设计的一个范例。第二方面是提高计算机的性能,包括开发从数据、指令到处理机各种层次的并行性,改善编程环境,减少人工时间。必须指出,并行处理不是万能药。当问题规模足够大时,线性增长处理机数目不可能对付计算量指数增长的NP-困难问题。即使把地球上所有的分子都用来做成巨大无比的分子计算机,也不可能解决1000个城市的旅行推销员问题(TSP问题)。由于改变了问题描述(这是降低问题复杂性的唯一方法),量子计算机可以开发指数级的并行性,因而有可能解决某些NP问题,如著名的Shor算法理论上可在多项式时间内用量子计算机求解大数分解问题。但由于技术实现上的困难,15年内也许难以做出真正实用的量子计算机。第三方面是通过物理发现和新器件的发明提高器件处理速度和集成度,为设计更高水平的计算机提供硬件基础。数学、物理、计算机与其他专业知识需要交叉融合才能提高求解问题的质量与效率。

微处理器和并行计算机都已遇到可拓展性、功耗处理效率和可靠性方面的瓶颈与障碍,必须在体系结构、软件和元器件方面实现革命性的突破,才能较根本地解决这些瓶颈的障碍问题。高性能计算机能力的突破需要物理研究等领域新的科学发现和元器件的新发明。自旋电子学、磁电子学、超导、纳米、MEMS、全息、三维存储、分子电子学、光互联技术等等都可能为突破高性能计算机的瓶颈做出重大贡献。比如,IBMMotorola、英飞凌等公司经多年研究后即将推向市场的磁随机存储器(MRAM)被计算机界看作存储器件的“圣杯”(Holly Grall),它可以具有接近DRAM的集成度、SRAM一般的存取速度、Flash存储器一样的不挥发性和较低的成本。在200411月的Supercomputing大会上,IBM公司宣布他们将采用一种像硬盘一样便宜而像DRAM一样高速的新型存储器研制千万亿次超级计算机,估计就是MRAM一类的存储器件。MRAM的出现将引发存储器的一场革命,但据了解,我国只有中科院物理所等少数单位承担973、自然科学基金委课题,在做有关MRAM的基础研究,虽然已晚了一拍。MRAM只是一个例子,其他新器件可能对HPC的影响更大。我国只有在决定HPC命运的基础研究上花功夫,才能在HPC领域另辟蹊径、后来居上。

另一方面,高性能计算机是基础研究的强有力的工具。近几年许多高校购买了高端计算机,学习并行处理的科研人员逐渐增多。但是,要提高我国数理基础研究的水平,需要大面积地普及高性能计算机的应用。并行处理应成为各高校研究生院的公共基础课,各个专业的研究生都应该会用并行计算机。中科院计算所正在研制基于龙芯CPU(奔腾4水平)的个人用桌面高性能计算机,性能至少是当时最高水平微机的10倍以上。计划2007年推出1000亿次水平的个人HPC16GB内存,价格在2万元人民币左右。2010年推出1万亿次的个人高性能计算机,128GB内存,价格不超过5万元,我想每一个博士、硕士生导师都买得起。

Compu-XX-info还在不断诞生,计算机与物理、生命、社会科学的交叉融合已成为计算机科学的主流。