国内首个基于Windows操作系统的GPU高性能计算集群研制成功
一个普通的实验室里,在一台普通的台式机上发出一条集群工作的指令,通过一个小小的交换机,三台计算机同时进行演算,一个蒙特卡洛的计算问题在3秒钟内就完成了,比单独由一台机器完成的速度提高了60倍以上。这个简单例子的演示让笔者直观地了解了“基于Windows操作系统的GPU高性能计算集群”。
日前,北京师范大学信息科学与技术学院研制成功了国内首个“基于Windows操作系统的GPU高性能计算集群”,该集群具有峰值浮点计算能力高、廉价、配置灵活、易于扩展、使用方便、能效高等突出优点,可满足国内众多学科对于超高性价比的绿色高计算能力的需求,非常适合于100人以下规模的小公司、院系级计算中心及课题组或实验室等单位快速组建自有的高性能计算平台。
据项目负责人骆祖莹介绍,该GPU高性能计算集群包括1个基于Windows HPC Server 2008 R2集群操作系统的头节点、与10个基于Windows 7操作系统的工作站节点。工作站节点采用CPU+GPU的异构台式机,CPU为4核8线程的i7-860处理器,GPU为每秒1.63万亿次峰值浮点计算能力的GTX470处理器。整个GPU高性能计算集群的峰值浮点计算能力为每秒16.3万亿次,峰值功耗4.95kw,占地40平方米,仅耗资10万元。
在系统集成方面,目前主流的计算机集群都是基于高可靠性的服务器进行系统集成,可满足长周期无故障的连续工作,但价格昂贵,为强调可靠性的大型或专业机构所拥有。而北师大该项目研制的GPU集群则采用台式机设备进行系统集成,同时台式机又采用了主流的CPU与GPU配件,即插有高性能显卡的多核CPU台式机,所以该GPU集群具有价格低廉、通用、高性能等优点,但其可靠性稍差,对于大多数既需要高性能计算能力而又不需要长时间运行的小型单位而言,这是一个非常理想的高性能集群廉价集成方案。
在应用方面,目前主流的计算机集群都采用Linux或Unix操作系统,具有可靠性高、兼容性好的优点,但需要专业人士进行集群的使用与维护。而该项目研制的GPU集群采用了Windows HPC Server 2008 R2集群操作系统(Windows7操作系统的HPC版,2010年8月正式发布),易于使用与维护,不需要专业人士,节约维护成本。同时,由于所有工作站节点均为采用Windows7操作系统的台式机,做集群计算时,它是集群的工作站节点;不做集群计算时,它就是一台普通的台式机,可以处理文本、表格、流媒体等日常工作,也可以进行单机版GPU+CPU并行计算的计算机算法研究,因此该GPU集群不仅具有多用途的优点,而且可以在原有的办公室或实验室中直接构建。
在北师大地遥学院“图像几何矫正”应用研究中,与采用4核8线程CPU并行加速算法的2分钟执行时间相比,采用GTX470显卡的GPU并行加速算法的执行时间仅为3.7秒。
目前,课题组基于该GPU高性能计算集群,已开展了电子设计自动化、加解密、数据挖掘、图形图像处理、视频处理、虚拟现实等算法加速研究,初步研究工作表明:与配置4核8线程CPU的单机并行加速相比,该GPU集群可以获得2个数量级以上的加速效果。在地球遥感、灾难控制、生命科学等学科都可以广泛应用。(曹宁)
《科学时报》 (2011-3-8 B2 校园)