孙凝晖:网络计算创新研究院——新阶段 新使命

(孙凝晖 2019年3月5日)

  2018年一个最重要的事就是计算所作为依托单位获批筹建中科院网络计算创新研究院。这样一个新机构、新平台,可以做哪些跟过去不一样的事情?今天利用这个场合,跟大家汇报一下,研讨一下。

  一、2018:中国复兴之路在这里转弯

  2018年,是一个特殊的年份,发生了很多可以载入史册的事情,比如中兴事件、中美贸易战等。去年我花了很多时间在院里做信息领域的规划,给国家写各种应对的建议,中兴事件确实对我们科研领域影响很大。

  2018年也是改革开放40周年。这两天巴塞罗那电信展,很多人说今年变成了“华为展”,全是5G。华为有今天这样的国际关注度,也是得益于改革开放40年。2018年还是马克思诞生200周年,事实证明,马克思当年很多论断,放到今天还是正确的。2018年,世界进入了振动模式,中国复兴之路在这里转了弯。

  1、西方的国家命运

  从更长的时间维度来看一下一个国家的命运。我们可能都看过《大国崛起》那个电视片,大致150年可以作为观察一个国家命运转折的时间轴。中国很多朝代也是这样,一个朝代的兴起之路,也需要100年到150年左右。英国强大起来走了150年,从1640年开始资产阶级革命——“光荣革命”,到1800年,我们在康乾盛世的时候,它到达了顶峰。英国率先进入了工业时代,开展全球贸易,建立了日不落帝国。美国也是如此,美国1776年建国,到1865年才结束南北战争,进入建设时期,从1800年开始算,到1949年,我们结束半封建半殖民地的历史阶段,恰好也是150年。美国率先进入了电子信息时代,利用全球资源建立了超级大国。日本也是一样,从1853年7月8日佩里登陆久里宾海岸,打开国门开始,到1990年,发展稳定了下来。它的现代化道路是以融入西方主导的政治和经济体系作为敲门砖的。可能一个国家的命运,要进行大的转变,不是改革开放40年或者建国70年就能够完成的。

  现在经常讲的一个词是弯道超车。在美国对英国的弯道超车过程中,也有一些有趣的事件。去年美国说我们偷了他们的知识产权,是个“小偷”。可美国历史上也是一个著名的“小偷”,而且正因为“会偷”,国家发达了。美国当年的工业社会是怎么形成的呢?独立战争以后,在1791年,当时美国政府出台了一个很著名的《制造业报告》,跟我们现在的“中国制造2025”是类似的。主要措施是要用关税,保护美国的工业,要以国家有组织的形式从欧洲获取技术,要搞贸易保护。美国历史上有非常著名的三个工业间谍:Samuel Slater、Thomas Digges、Francis Lowell,都是他们的民族英雄。英国当时为了避免美国盗取它的纺织等工业技术,对所有到美国去的船只、人员都进行检查。美国间谍们为了把那些纺织机械带到美国去,进行分散包装,伪装成别的货物,运到美国再组装起来再生产。就是这样,美国从纺织业开始的,通过全盘引进、“窃取”英国的技术,完成了工业化的第一步。其实当年英国起步的时候,也是个“小偷”。著名的福琼就是窃取了中国的茶叶技术的“大盗”。他当时在福建、云南一带,找到一些方法,把茶叶的小苗,育种好了以后,再装到船上运到海外另一个地方再种植。那时的茶叶相当于现在的iPhone,是非常值钱的。所以我觉得这种引进和学习,对一个国家的崛起是必然的。当然每个先进技术的拥有者都希望后进者永远赶不上自己,要付出巨大的代价,而后进者努力用很少的代价,来弥补上这个差距。历史上的高科技——中国的茶叶技术、英国的工业纺织技术,都是被弯道超车的例子。

  2、中国的国家命运

  中国也需要150年来复兴。每30年算一代人,我们是不是需要五代人的牺牲和努力?我觉得中国人的牺牲精神,是最宝贵的品质和竞争力。中国人到美国,第一代当打工仔,第二代就可以开一个小饭店,当小老板,第三代就培养出大学教授、议员了,就是靠的一代一代的牺牲。希腊人到美国,第一代在钓鱼,第二代还在钓鱼,第三代依然钓鱼。他们不会为自己的子女和家庭作出牺牲。所以,大到一个组织、到国家,小到一个家庭、一个课题组,如果没有牺牲精神,很难上台阶。我们国家的第一个阶段,1921-1949年,从积贫积弱,到实现中国人民站起来了,当家作主。第二个阶段1949-1978年,从一个农业国,在全面被封锁的前提下,做到了工业门类的齐全,这是毛主席的伟大贡献。第三个阶段1978-2018年,从一个初级工业国,通过改革开放,利用全球化,把制造业做到世界第一。但是高技术只能说是一个点状的布局,只有航天、高性能计算机、高铁、互联网、通信这样一些点上的优势,还没有形成门类齐全的一个生态,所以还在被制约。第四个阶段2018-2049年,在美国封锁高科技的条件下,我们要实现门类齐全的高科技,做成自己的技术体系,做好自己的生态,工业产能输出到一带一路40亿人,实现两个百年的目标。第五个阶段2049-2071年,中国要变成高科技国,在智能时代,通过全球命运共同体这样一个全球政治理念,重新站到历史的巅峰。

  科技要起关键核心作用。对比一下我们跟美国的差距。制造业上,中国是5万亿美元,美国 4万亿美元,我们是超过美国了。但服务业上,中国是7万亿美元,美国是16万亿美元,是我们的两倍多。举一个出租车司机的例子,中国的出租车司机辛辛苦苦干一年才5万人民币,美国的干一年是5万美元。为什么干同样的事,美国的司机就挣钱多呢?网上有一个观点,我觉得有点道理,说因为美国有苹果、亚马逊、Google这样的公司,这些公司的市值大概在20万亿美元,利润率都很高,股票价值增长很快,收益很好。美国居民一共有30万亿的养老资金,这些养老金主要投资美国的优秀企业。美国居民没有全世界买房,也没有投美国的房地产,而是买优秀企业的股票。所以一个普通的美国人,他敢于把他的钱用来买服务,是因为他们的资本收益大。我们中国不是这样,中国普通老百姓的钱,靠什么来获得自己持续的有保障的收益?除了买房地产,确实没有别的办法。但房地产投入是很大的,得花几百万、用很大的杠杆才能去买。有人质疑说计算所怎么能办公司呢,一个研究所办公司是错误的。我觉得要说明两点:一个是计算所绝不办公司,而是“创办”公司,不能把创字去掉。第二是计算所如果不创办公司,我们有一个“华为”行吗?中国至少需要30家华为,那华为怎么出来的?我觉得中国的科技界一定要通过领先的技术来创办公司,让中国企业能够像美国这样,有高额利润,让更多的人受益。计算所并不是办公司的,不是天天在做销售或者生产,而是一直都在搞创新,但是我们所跟公司保持着很密切的关系。

  3、国家命运下的计算所

  我总结了一下国家命运下的计算所的几个阶段,分为六个台阶,每15年上一个台阶。第一个台阶是初创期,中国计算机事业从这里诞生;第二个台阶是打破封锁,服务“两弹一星”;第三个台阶是冲破垄断,建功中国计算机产业;第四个台阶是自主,保障网络与产业安全;我们现在所在的第五个台阶要引领,发展颠覆性技术。第六个台阶到2049年,做到世界领先。每年我都要看一下中国万亿俱乐部城市的名单,了解中国经济发展的趋势。2018年17个城市进入万亿俱乐部行列,就是说GDP达到1万亿人民币,而头部城市普遍进入了人均2万美元的中等发达阶段。可以看出头部城市GDP的增长还是非常好的,基本在10%以上。邓小平说过发展才是硬道理,这张表给我们带来信心。国家发展有信心,我们科技界才有资金做研究。这也能解释了列表中为什么有这么多城市,纷纷支持计算所办分所,一个城市可以给一个亿支持我们做研发。

  二、网络计算创新研究院

  1、为什么申请创新研究院

  计算所为什么要牵头申请网络计算创新研究院?简单总结有两个目的:一个是解决芯片之痛,一个是创建我们命名为“信息高铁”的新型基础设施技术体系。这两个目的又是密切相关的。

  众所周知,信息基础设施关系国家安全和重大利益,关系产业命脉,我国当前的信息基础设施,是跟随上世纪90年代美国“信息高速公路”计划建成的,满足了中国8亿人上网需求,但是中兴事件暴露了我国的缺芯之痛,我国做了很多款CPU,但是市场份额还是百分之零点几,四舍五入之后就没有了,在市场统计上看不见。我国的华为、BAT也都建立在美国的信息高速公路这个技术体系之上,未来依然存在被制约的可能。在智能网联的时代,到2025年,我们有千亿的物端设备,智能会无处不在,无线的网络和卫星的网络会无缝覆盖,所以一定会需要新的核心芯片和新的关键设备。关键是我们能不能把握住这个核心设备,形成中国自己的技术体系、一个有国际竞争力的技术体系,而不是在国外的基础上突破单个设备。这就是联合院内多个研究所、多个关联企业组织成创新研究院要做的事情。

  什么是“信息高铁”?“信息高铁”不是一个设备,不是一项技术,而是一个技术体系的名字。当前的信息高速公路的特征是高带宽、尽力服务、局部智能、有限覆盖,而未来的“信息高铁”则是以高通量、时间确保、端网云泛在智能、无缝网络全覆盖为特征的。这四个特点,今天的信息高速公路是不具备的。

  “信息高铁”必然是成体系的,应对的就是三大洪流——物端处理器和超级基站要应对“连接洪流”,虚拟路由器和大数据实时分析引擎要应对“数据洪流”,高通量计算机、智能处理器与智能计算机要应对“服务处理洪流”。在“端”要解决千亿级智能物端,在“网”要解决接入网和骨干网的无缝网络覆盖,在“云”要解决智能算力和服务保障的要求。

  2、创新研究院的目标和任务

  网络计算创新研究院的总体目标就是针对我国信息基础设施的重大需求,攻克通用CPU、人工智能处理器、物端处理器等三大处理器核心芯片,研制智能超算、高通量云服务器、虚拟路由器、超级基站等四大网络计算关键装备,发展大数据处理系统;短期补全我国处理器芯片上受制于人的短板,长期发展出引领型的芯片与关键装备,培育长板,在2035年实现信息领域的战略平衡。与中科院集成电路创新研究院共同争取集成电路与处理器国家实验室或国家技术创新中心。主要包括八大任务:

  任务一:通用处理器

  定位:面向现阶段信息高速公路被制约的问题,在急需的核心处理器芯片上补短板。

  研究内容:1)研制龙芯处理器(装备与桌面)、海光处理器(服务器);2)研制面向国产处理器的通用操作系统,无缝兼容大部分Windows应用。

  任务二:人工智能处理器

  定位:信息高铁的核心芯片,是未来泛在智能的物质载体。

  研究内容:1)低功耗智能芯片:应用于手机/物端,智能计算的能耗降低到人脑水平);2)高性能智能芯片:用于云端的推理和训练,发展神经网络的新型体系结构);3)寒武纪指令集:构建产业生态体系;4)面向人工智能芯片的智能操作系统。

  任务三:物端处理器

  定位:信息高铁的核心芯片,是千亿物端设备的处理核心,使万物具备”计算、存储、通信、感知、交互、控制”等功能,真正实现万物互连。

  研究内容:1)两大核心IP核:物栖通用处理器IP核、大度控制处理器IP核;2)以开源的RISC-V为核心构建物端生态,不再受西方控制;3)研制物端操作系统和weblet应用平台。

  任务四:智能超算

  定位:信息高铁的计算能力中枢,为千亿物端应用提供云端智能算力保障,主要实现“算的更快”。

  研究内容:1)架构:应用驱动的软硬件一体化结构,海光服务器CPU+寒武纪MLU智能处理器;2)算力:峰值1EFlops + 30Eops, 每秒可处理一百万亿神经元、五十亿亿突触(成人大脑约为千亿神经元、百万亿突触)。

  任务五:高通量云服务器

  定位:信息高铁的数据处理中枢,为千亿物端应用提供数据洪流下云端的服务能力保障,主要实现“算的更多、更省”。

  研究内容:1)睿芯高通量加速器(算得多);2)标签化冯诺依曼体系结构(算得省,云计算数据中心)。

  任务六:虚拟路由器

  定位:信息高铁的骨干网核心装备,在千亿连接、服务请求方差巨大的信息洪流中,提供可编程、可定制、服务质量可控的网络传输通道。

  研究内容:1)网络断层扫描 (NetCT);2)网络指挥测调中心(新CNNIC)。

  任务七:超级基站

  定位:信息高铁的接入网核心装备,传统蜂窝接入主要覆盖“人”,超级基站要“更好”地覆盖“物”,单台设备接入能力从百提升到十万,并可根据“物”的需求提供多种类的专网。

  研究内容:1)终端基带芯片:多模(融合卫星、4G/5G、工业互联网、北斗)终端基带芯片;2)超级基站:多波束、海量用户的集中式基带信号和协议处理,部署灵活、多模融合的地面基站。

  任务八:大数据处理系统

  定位:信息高铁的通用大数据分析引擎,面对洪水般流量,提供实时数据分析能力。

  研究内容:1)大数据处理微内核:轻量级内核架构、新型软硬件协同抽象,延迟可控;2)算法驱动的弹性架构:流批混合、异构资源协同框架;复杂调度、均衡的自主学习与控制;3)低熵序化的的分析引擎:核数据驱动的简约分析框架、面向业务的大数据分析语言。

  八大主要任务怎么连成一个新的信息基础设施的技术体系,来体现“信息高铁”的四个特征,任务之间怎么协同,这些还是未知的。需要一种新的机制,把这些设备连在一起,把这些工作串在一起,连成一个系统,能够到一些应用场景里面进行落地。这个就希望通过创新研究院的机制来解决。

  3、创新研究院的机制举措

  目前已有的一些重大资源的支持,包括中科院项目的智能超算、存储驱动计算、科技委的智能芯片和智能计算机、发改委的地球模拟器等大项目支持,计算所、自动化所、软件所、网络中心、集成电路创新研究院等都在参与。所以通过创新研究院希望把这些研究所,能够形成一个像集团军那样的合力,来承担国家更多的重大任务,解决一些更大的任务级的挑战。

  对网络计算创新研究院来说,第一个机制是希望能够跟集成电路创新研究院结盟。网络计算创新研究院擅长API、IP核这一端,集成电路创新研究院正好擅长工艺和EDA。如果双方能够合作起来的话,可以率先形成垂直的整合研发机制,为申请集成电路与处理器国家实验室提供关键机制保障。

  第二个机制就是发挥“资本+平台”的模式推动产业整合。发挥资本之手的作用,整合院内在芯片和网络、计算装备方向产业化力量。通过打造基金联盟,投资一些关联企业,影响关联企业往一个技术体系走。另一个是要建一个平台,建十个信息高铁的试验场,成为企业创新产品的首购方和验证方。把这些企业纳到整个创新链的环节里面是实现“信息高铁”不可或缺的。

  第三就是计算所内部也进行了一些组织变革来适应科研体制深化改革。改变以研究中心/实验室为核心的“步兵团/坦克营”式科研组织模式,建立一个“集团军”、两个“混成旅”。创新研究院相当于是一个集团军,是一个重大任务单元,混成旅分别是科教融合和科学发现单元的混成旅。

  计算所是在改革中成长起来的,每一次改革,都能让计算所再上一台阶,改革是触发计算所科技事业上台阶的发动机。通过四项紧急措施,计算所建立了学科;通过归属国防部计算所作出了109丙功勋机;联想代管让我们PC做到世界第一;知识创新工程让我们HPC产业在国际上领先了;现在的创新研究院, 把解决芯片之痛和创建信息高铁这个技术体系,作为我们未来的目标。

  三、几项重要的工作

  1、李院士之问

  第一个就是要回答李院士在去年年底考评会上提出的问题:计算所有没有在做一些全世界都觉得难的事。我想了想,有以下几个。

  一个是Z级计算机,肯定是全世界都觉得难的,不知道该怎么做的。性能怎么再提高1000倍呢?超导处理器,光子计算、访存与互联,存算一体与分层计算等这些研究大致是奔这个目标的。

  第二个是标签结构,我也觉得是一个很难的事情。通俗地说,就是说又让马儿不吃草,又让马儿跑得快,在多任务下达到资源利用率高、完成时间可确保,应用场景可覆盖云计算的多租户、手机的低功耗、实时计算机的强实时等。如果能让世界上50%以上的芯片都用了这样一个标签结构的话,那就是一个全世界最难的工作之一了。

  第三个是芯片即App,就是说芯片是不是能像开发App那么简单,从3年缩减到3个月,从Fabless到Designless。xPU时代最重要的是功能,而不是里面的结构和设计,开源芯片不仅仅是指令的开源,还要有开源IPs 、开源EDA、DesignHouse云等。

  第四个是卫星互联网,建成覆盖一带一路40亿人口的一张全世界最大的网,做到可控可管,千倍提高。如果这个实现了,也是全世界觉得非常难的事情。

  2、凝聚大事

  计算所现在还没有跨研究部、跨学科,来做一些重大任务和重大项目,最近规划的这几件大事希望能够达到跨学科整合的目的。信息高铁这个事就是把系统和网络整合在一起,智能计算机是把系统和智能整合在一起,军工重大任务是大数据和智能整合在一起。计算所的三个研究部如果两两能够耦合在一起的话,那计算所的竞争力就会得到极大的提升。

  举一个例子,去年计算所拿到的专用智能计算机项目,把军科委的智能处理器和智能计算机两个项目紧耦合的整合在一起,同时整合了六个科研团队(高性能、高通量、控制计算机、泛在计算、先进计算、专项中心)和六个相关企业(曙光、寒武纪、睿芯、龙芯、天玑、视拓),做成专用智能计算机。希望智能计算机有三个有显示度的出口——智能农机、工业互联网和专用智能。计划在2019年努力推出四台世界领先的系统:中科院超算中心的曙光7000系统,希望在超算方面做到世界领先;珠海超算中心的寒武纪超算系统,希望在深度学习上面能做到世界的领先;盐城高通量计算中心的金刚系统,在高通量应用指标做到世界领先;环保园专用智能试验场的创智1000系统,在专用负载加速上面做到世界领先。

  3、计算所的四个体系

  计算所运转的主要四个体系分别是源头体系、领头体系、龙头体系和影响力体系。源头体系是包括前沿研究和技术转移,领头体系包括学术和教育,龙头体系包括专用和安全,影响力体系包括传播和公益。

  其中最困难的是建立计算所特色的专用体系,由专项部、专项中心、科研型分所、企业等新机制组合而成。计算所特色的专用体系是什么,怎么区分于声学所、电子所这些专用大所,这是值得思考的地方。还有就是如何扩大计算所的影响力,一个一流的组织,一定是有非常强的社会影响力。计算所去年成立了科协,就是要把计算所对公众的影响力组织化、常态化。我多次提出要支持“人人编程”这个运动,是基于信息社会对中小学的孩子们教些什么的思考。纪监审大数据能帮助将权力关进笼子里,计算所用技术手段做到这一点,就体现了我们在国家治理方面的影响力。还有残疾人信息化,国家在6000万人脱贫后再干点什么,让每个人都进入信息社会,这个工作也是发挥计算所影响力的工作。

  4、计算所模式

  计算所的发展模式是三头并进、相互转化。计算所的100年是:过去以“龙头”为主(1958-2005),价值是科技力量要能服务保障国家安全,实现手段是靠集中力量办大事,驱动方式是任务驱动。现在以“源头”为主(2006-2035),价值是科技力量要能发展成为有国际竞争力的产业,赋能各行各业,转化为产业的力量,更全面地支撑国家的发展,实现手段是从学术前瞻到创办公司,驱动方式是应用驱动和市场驱动。未来以“领头”为主(2036-2058),价值是为世界信息科技的人类知识宝库做出自己的贡献,实现方式是写进教科书,学习Patterson、Hinton引领全球产业,驱动方式是学科驱动。

  “源头”模式有没有什么措施?我把它叫做“九字真经”,有三句话:第一句叫“养源头”,源头决定着大江大河的流淌方向。源头养好了,才能做大事,尤其IT这个产业,没有学术引领,很难产生有影响的产业。其实计算所一直到2006年的时候,都没有形成自己的基础研究体系,这十几年形成了自己的三大学科——系统、网络和智能的基础研究体系,围绕这三大学科,建立了四个重点实验室,作为学术基地。做好学术引领,是发展产业做大事的核心保障。

  第二句叫“抬起点”。举个例子,唐古拉山、祁连山脉最高峰和京西东灵山,绝对海拔基本都是2000多米。唐古拉山之所以能有6000多米的海拔是因为它在青藏高原上,而祁连山脉是在黄土高坡上,京西东灵山是在河北平原上,它们的区别在于起点不一样。斯坦福大学就像青藏高原,成就了众多“高峰”企业。要让科研成果达到更高的高度,就应该建立更高的平台,这才能可持续更长久地发展。计算所这些年一直在打造“人人是才、人人幸福”的创新文化产品,营造从优秀到卓越的文化氛围。通过“人人是才”产品,将人才结构从“拔尖长尾型”转变成“冒尖短尾型”。我们去MIT访问,有一个感受是,教授之间的水平没有太大的差别,都是相对比较高的级别,所以容易成就这样一个高峰。通过“人人幸福”产品,要将员工结构从“一枝独秀型”转变成“高台多元型”。不光鼓励做科研的,还鼓励做产业的、做管理的、做科普的、做教育的、做国际学术交流的等,每一个类型的人才都要有,他们组合搭配在一起,才是好的员工结构,才能有高台。

  第三句叫“造生态”。还是拿高原举例子,高原的良好发展更加依赖生态建设,青藏高原、黄土高原的生态都很脆弱。越往高处走,生态越重要。计算所的生态就是不唯帽子,宽容为本,人人幸福。举个例子,有两个有代表性的年轻研究员,都是团队负责人,一个是陈云霁,是帽子最多的代表之一,头上有很多人才帽子,另一个是包云岗,他自称自己只有一顶草帽,就是中科院青促会优秀会员,但他的工作也做得很好,做了很多原创性的工作,在国际上很有影响。他们两个在计算所都同样被重视。

  贺思敏研究员举的例子我觉得很能代表计算所模式。他说自己在游泳池里学游泳,游得很好了,到了北戴河,不敢游了。我想杰青等人才,就像是一个奥运冠军。孙杨在游泳池里可以拿冠军,但是如果让他去水泊梁山打仗,可能就不如阮小二、阮小七了。计算所的科研人员应该能够做“浪里白条”。但也不是说不要做杰青,首先得学会在游泳池里游才行。在计算所做什么样的工作,什么样的人,能体现计算所学派,体现计算所的价值?每个人都想想,你的人生目标是当孙杨,还是当阮小二。

  5、几个思考

  最后谈几点思考。一个是我一直在想创新的本质是什么。元旦看罗振宇跨年演讲,他说:创新就是非共识,创新的模式从过去的抽象,现在走到了还原。我在想通用处理器是不是就是抽象,现在做领域专用处理器,是不是就是还原,还原到应用负载的本质部分。现在的创新主要用还原法做非共识的工作。他还举了从拓碑印字到活字印刷花了一千年的例子,创新好像很容易,其实很难。

  那什么是一个伟大的创新?他说:是“异端邪说、伟大革命、稀松平常”三部曲。英国科幻作家道格拉斯·亚当斯,也就是《银河系漫游指南》的作者,他有个说法,叫“科技三定律”:“任何在我出生时已经有的科技,都是稀松平常的世界本来秩序的一部分。任何在我15-35岁之间诞生的科技,都是将会改变世界的革命性产物。任何在我35岁之后诞生的科技,都是违反自然规律,要遭天谴的。” 这段话描述了很多人对科技创新的心态。任何创新在它诞生的那一刻,先会被当作“异端邪说”,然后成为“伟大革命”,最后为“稀松平常”。这是一个神奇的循环,不走完这个循环,就不是伟大的创新。

  最后一个思考,在中美之间从分工式合作走向对抗式竞争的国际形势下,如何发挥出中国的“由大带强”和“东方优势”,发展出国际化的高科技产业?高通量就是围绕“多”来做文章, “强控制”就是东方的基因。信息高铁的网络测控要在网上加上控制,超级基站要强控制,信息高铁就是一个强控制的技术体系。

(根据孙凝晖所长在2019年计算所春季战略规划会上的讲话整理而成)

附件: