“每到临近节假日的时候,我们的工作总会显得异常紧张和忙碌。”山东省气象局工作人员如是说。农历春节刚刚结束,普通人的感觉是团圆与喜庆,而气象工作者会感觉到别样的紧张。如何在春节期间全力做好气象服务工作是各省市气象单位的重要工作,而山东省极端天气的突发事件更多,天气变换更为频繁。另外,山东省在我国能源、贵金属、粮食、海洋战略等方面还承担重要角色。因此,气象预报对山东省经济发展显得尤为重要。
气候瞬息万变,预报难度巨大
山东省气象局作为全省气象管理中枢部门,在新环境下肩负重要职责,包括制作并发布全省范围中短期天气预报、短时临近天气预报、雷电天气预警、大气成分预报和灾害性天气警报等,并承担全省天气、大气成分等方面的技术开发和应用研究及调查,供省级领导部门提供建议。
为提供精准可靠的气象预报数据,山东省气象局高性能计算系统的构建与应用需求就显得迫切。一般地,天气预报过程可分为四个主要部分,其中第三部分——模式运行——是预报过程中的重要部分。WRF又是其中应用最广泛的一种运行模式,该模式具有计算量大、通讯密集、I/O要求高和规范的模式系统化集成等特点,对高性能计算系统的计算性能有着超高的要求,具体要求表现如下:
计算量大:气象预报本身具有时效性,要求定时定点自动运行,无需人工干预。一般每天在固定的2-4个时段运行,每个时段2小时内运行完。因此,必须使用计算性能卓越的高性能计算系统来进行并行计算。
通讯密集:由于采用并行计算,因此各CPU间的通讯量很大。主要体现在WRF各计算域间的通讯及各类不同数据划分间的通讯。因此,要求本高性能计算系统在具有高性能计算的同时,兼具高性能的通讯网络。
I/O要求高:由于涉及大量的用户和大量的小文件读写,气象模式对整个系统的IOPS性能有较高要求,存储系统的稳定性和可用性对整个业务系统的运行至关重要,要求存储系统具有故障自愈功能。另外,考虑到气象数据的周期性访问特点,需要支持基于策略的分级存储功能。
模式系统集成化:从软件的处理流程上看,一般分为前处理、主模式和后处理。整个模式系统从前处理到主模式再到后处理,需要系统具有较高的稳健性,所以优秀的模式软件应用专家支持、硬件级的系统技术支持,对预报模式的良好使用也是关键。
综上,为满足山东省气象局当前业务需要及未来业务发展要求,新建设一套高性能计算系统势在必行。
浪潮高性能计算系统为气象局掌握风云变幻提供基础
山东省气象局为实现精准、有效的高性能计算应用效果,多次向同行业中高性能计算应用的先行单位咨询考察,最终选定浪潮高性能系统解决方案。
浪潮拥有国内最系统化专业化水平的数值预报领域的HPC支持团队及众多数值预报领域的高性能计算成功案例,浪潮结合行业特点并从应用出发,提出的解决方案不仅针对性极强,并具有如下诸多优势:
计算节点:浪潮解决方案采用高性能Intel Xeon E5系列处理器,计算节点采用双路计算节点浪潮NF5270M3与四路计算节点浪潮NF8420M3混搭方案,其中,大量双路计算节点与WRF特性匹配,可将WRF模式的并行性发挥到极致,四路计算节点依靠其突出的计算能力与内存容量,可在一台机器上完成中小模式的处理分析,减少资料预处理、计算、分析的时间,提高计算效率。
高速网络:采用高性能专用高速IB网络,将计算节点、管理节点、登录节点全线速互联,保证集群通讯网络的高性能。并将NAS存储通过万兆连入高速网络,配合集群并行文件系统,实现全部节点的数据共享。
存储系统:浪潮综合以往存储硬件解决方案,系统应用要求存储设备具备的特点,及浪潮在多年高性能计算领域的实施经验,采用浪潮集团“高效能服务器和存储技术国家重点实验室”专为此项目定制而成的Tstor存储系统,充分满足用户现阶段使用及未来扩展需求。
低功耗:浪潮解决方案不仅强调整体运算效率,同时强调单位体积内的计算能力以及单位能耗可提供的计算能力。本项目服务器均基于浪潮睿能技术,可实现系统功耗的实时监控与上限控制,根据系统实际负荷智能调整功耗和风扇转速,大量降低系统功耗。
可扩展:计算系统采用浪潮,既可保证节点内的扩展性,又可保证整个集群的横向扩展性,总体上,满足用户对未来集群的扩展需求。
此外,浪潮还采用Cluster Engine集群监控管理整个系统,提供集群部署、监控、告警、管理、统计、报表、作业调度等丰富功能。软硬一体化的部署方案,提高了整个高性能集群系统的可用性、稳定性,并简化了山东省气象局工作人员的工作量及工作难度。浪潮还与山东省气象局组成应用开发团队,共同进行高性能计算在气象领域方面的研究和开发,特别是在中尺度天气预报相关应用软件的优化方向。
该高性能系统投入使用后,山东省气象局的气象运算效率大幅提升,这将为山东省气象局的预报时间精度和区域精度提供强有力的推动作用,为山东省的恶劣天气预警、水文气象分析、气候研究等提供有力的计算支持,更快实现“未雨绸缪”的目标。
山东气象局相关负责人表示,“浪潮构建的高性能计算系统从实际运行效果看,性能非常出色,完全可以满足中尺度数值模式的计算需求”。