联想集团祝明发讲授高性能计算机体系结构与设计
-
孙树岩 (信息科学与工程学院)
-
创建于 2009-06-15
-
1486
6月13日至7月11日的每个星期六上午,联想集团祝明发研究员都将来到信息学院给大家教授“高性能计算机体系结构与设计”课程,这是信息学院在2009年夏季学期开设的高级强化课程。
6月13日,祝老师给同学们上了第一堂课。他首先向大家提出了两个小问题,大家踊跃回答,极大地活跃了课堂气氛。随后,祝老师认真细致地向大家讲述高性能计算机体系结构的概念和发展历史等知识,同学们进一步加深了对计算机体系结构的认识。
祝明发老师是中国计算机体系结构及高性能计算机领域的资深科学家,是中国民族高性能计算机产业的倡导者和开拓者之一。他于1970年毕业于北京大学物理系,70年代在北京大学参加我国早期大规模集成电路研制工作,研制成功我国第一代大规模集成电路产品40位移位寄存器芯片,参加了我国第一台百万次大型计算机(北大150机)研制工作,并任运控(CPU)组组长。1985年他获得美国密西根州立(韦恩)大学计算机工程博士学位,并在美国奥克兰大学做博士后研究工作。1987年回国后他任中科院计算技术研究所研究员和博士研究生导师、国家智能计算机研究开发中心副主任,组织指挥了国家863计划五个型号的大规模并行计算机和超级服务器研制及产品化工作,为我国高性能计算机产业化进行了卓有成效的探索,实现了我国首台大型计算机的出口.他参与组建和管理7个国家高性能计算中心并任国家高性能计算中心(北京)主任,组织完成500多项国家及省市重要课题计算。
高性能计算机体系结构的发展目前正处于一个技术发展S曲线的平滑期,上一次结构变革带来的发展动力已经趋向平缓和成熟,而下一波技术突破正在酝酿之中,这一次变革很可能比上一次更为激烈。在集成电路工业界有一个著名的“摩尔定律”,即半导体芯片集成度和运行频率每18个月左右翻一番。摩尔定律在提出后的近30年与现实发展惊人的一致,并且预计还可能有效持续到2020年左右。这一定律深深地影响到高性能计算机体系结构的发展。现在一片最先进的微处理器处理能力很可能超过10年前的一台高性能计算机。从20世纪80年代中期开始,由多个微处理器组成的并行化高性能计算机开始取代传统的向量机,成为发展的主流。这一趋势从对称多处理机、大规模并行处理机一直发展到机群系统。近10年来,高性能计算机系统的性能增加了500倍左右,而其中摩尔定律的贡献就占了40倍以上。机群系统是这种以微处理器为核心的设计趋势发展到了极致的产物。机群系统是由多个以微处理器为核心的计算机节点通过高速网络互联构成。机群的节点一般是可以独立运行的商品化计算机,高速通信网络设备近年来也已经逐渐商业化,机群使用系统软件则多以开放式软件为基础。这种发展趋势使得有人认为至少在摩尔定律失效之前,机群结构就是高性能计算机的终结,制造更高性能的计算机系统只需要将机群系统的规模进一步扩大就可以了。但是机群系统正是在可扩展能力上遇到了麻烦。机群系统的节点本身并非为构造大规模并行处理系统而设计的,因此节点完成单位计算能力所需要的电能、空间和散热量等都比较大。机群系统扩展的另一个问题是其可靠性和可管理性。众所周知,并行系统的可靠性和节点的数目成反比:节点的数量提高10倍,可靠性就会下降10倍。原来一个系统可以连续运行1个月不出故障,现在3天就可能出一次故障。如果一个计算任务需要持续运行1星期以上,则在这样的系统上根本就无法完成。因此,研制更大规模并行系统或者更有效利用资源的系统成为当前高性能计算机系统研究的一个主要方向。
责任编辑:孙树岩