在生物制药与纳米材料研究领域中,分子动力学模拟计算方法有着广泛的应用,其是在原子、分子水平上求解多体问题的重要计算机模拟方法,可以预测纳米尺度上的动力学特性。通过求解所有粒子的运动方程,分子动力学模拟法可以用于模拟与原子运动路径相关的基本过程。在模拟计算应用早期,由于受计算机技术的制约,这些模拟的模型尺寸和时间均受到了限制,模拟研究的范围也有很大的局限。上世纪80年代后,随着计算机技术的飞速发展,这些限制逐渐减少,激发了分子动力学研究的高潮,被广泛的应用于新型材料研制、化学工艺模拟、大分子生物制药等领域,成为微观模拟的一个主流技术。
而在这些应用软件中,GROMACS进行了大量的算法的优化,使其计算功能更强大。例如:在计算矩阵的逆时,算法的内循环会根据你自身系统的特点自动选择由C语言或Fortran来编译。GROMACS中对Altivec loops的计算,无论是在Linux还是Mac OS X.系统上,它都要比其它软件快3-10倍 ,而且GROMACS提高计算速度并不以牺牲计算精度为代价。
GROMACS软件的计算优势使其对运行平台有着独特的需求。首先,GROMACS是计算密集型的程序,浮点运算量很大。在通信网络不是瓶颈的情况下,CPU的利用率比较高,通常可以达到98%以上。但GROMACS程序对内存的要求很小,模拟一个原子数目为12000的系统,需要的内存大概为10MB。其次,GROMACS软件有两种应用方式,即传统MD方式和REMD方式。传统MD方式中,进程之间的通信比较频繁。使用高端的通信网络(Myrinet,Infiniband等)可以提高程序的并行加速比,提高并行计算的效率。REMD方式中,进程之间的通信量很小,使用千兆以太网就完全可以满足通信的要求,不必要使用高端的通信网络。并且,GROMACS软件运行时的输入文件和输出文件都不是很大,对I/O没有特别的要求。
根据GROMACS软件的应用特点,定制化的基于GROMACS软件的高性能集群方案。系统整体包括用于运算的计算节点、负责系统管理和外部接入的管理节点,和连接磁盘阵列提供网络共享文件系统的存储节点等模块。系统中的计算网络将所有节点通过千兆以太网或高端网络进行连接,管理网络配合机群中间件对机群实现统一的管理,用户同时可通过SKVM网络对系统实现远程控制管理。整套系统的节点数量可根据用户具体需求而定,具有较大弹性,面对软件的运行要求,系统节点是X86体系,可支持各种Linux操作系统,采用目前高性能计算机的主流架构,具有良好的普适性。
制定机群方案前对GROMACS软件的运行进行了大量的测试工作,结果显示,GROMACS软件的性能基本上和CPU主频成线性关系。对于用户来说,要使软件合理运行,需要找到一个性价比平衡点。在系统对GROMACS软件进行编译时,只需要指定使用MPI,就可以使用并行的GROMACS程序。但在相同系统环境下,编译器对软件性能也有直接的影响,通过测试,GCC编译器在此类应用中略胜一筹。
通常情况下,一个中等规模的GROMACS应用机群系统采用曙光TC4000A机柜,含有内部网络布线系统、散热系统、供电系统。计算节点采用曙光A610r-F服务器,配备2×Opteron2214双核CPU,4GB DDR2内存,73GB 热插拔SCSI硬盘,集成2个10/100/1000M以太网接口。该款产品做为计算节点可轻松应对软件对内存及I/O负荷的需求,同时该款双路双核产品表现出的优越计算性能可满足软件频繁、复杂的浮点运算需求。
整套系统中的所有运算节点和管理节点都挂接在管理网络中,通过光纤交换机与高端的磁盘阵列柜相连。在系统工作时,所有节点及I/O设备由管理网络进行统一调配,协调运行,极大的提高了运行效率。同时,系统中的所有运算节点通过计算网络相连,计算任务通过计算网络在各节点间进行分配。整套系统中的管理网络和计算网络均为千兆以太网,可轻松满足软件运行的工作带宽,保证网络工作的稳定性和安全性。