- 积分
- 15
- 注册时间
- 2011-10-8
- 仿真币
-
- 最后登录
- 1970-1-1
|
本帖最后由 superuirui 于 2013-8-2 15:51 编辑
本人之前一直考虑如何提高NASTRAN软件在PC机上的计算效率。基于这个目的,本人搜集整理分析了相关的软件及硬件问题,最后给出了一套用于NASTRAN计算的PC机配置。请大家拍砖时轻点O(∩_∩)O~
CAE软件可以分为隐式有限元分析(IFEA)、显式有限元分析(EFEA)和计算流体动力学(CFD)三个子学科。下表中给出了CAE常用的应用软件,并列出这些软件的特点,包括并行方式和可扩展性。
CAE软件分类 | 应用软件 | 并行方式 | 可扩展性 | 隐式有限元分析
(IFEA) | ABAQUS | pthreads | <8CPU | ANSYS | OpenMP,MPI | MSC.NASTRAN | pthreads,MPI | 显式有限元分析
(EFEA) | LS-DYNA | OpenMP,MPI | <64CPU | PAM-CRASH | OpenMP,MPI | RADIOSS | OpenMP,MPI | 计算流体动力学
(CFD) | FLUENT | MPI | <128CPU | STAR-CD | MPI | PowerFLOW | OpenMP,MPI | 从上表中我们可以了解到CAE应用软件具有以下特点:
特点1:IFEA类应用软件(如ABAQUS, ANSYS和MSC Nastran)的可扩展性不是很好。当使用超过8个CPU来处理一个任务时,通常不会再有性能上的提升;
特点2:IFEA类应用软件通常使用共享内存方式(pthreads或OpenMP)进行并行处理,其中ABAQUS不支持消息传递方式(MPI)的并行;
特点3:EFEA类应用软件(如LS-DYNA, PAM-CRASH和RADIOSS)和计算流体动力学软件(如FLUENT, STAR-CD和PowerFlow)的扩展性相对较好;
特点4:EFEA类应用软件和CFD软件以采用消息传递并行方式(MPI)为主。
隐式属性特点决定了NASTRAN软件不具备很好可扩展性,而且NASTRAN对于超线程(Hyper-Threading,简称“HT”)技术的支持也不是很好(MSC建议对于具有HT技术的CPU,应将HT关闭以提高计算性能)。 所以对于隐式有限元分析类软件来说,计算单任务时,高性能PC机或者工作站也许是最好的选择,配置超过8CPU的平台没有太大必要。
同时,根据本人以往的计算经验,NASTRAN计算时间主要消耗在I/O以及与I/O有关的计算模块上(当然具体的数据及证据还在收集整理中),这使得由传统机械硬盘数据传输带宽过低所引起的瓶颈效益变得特别明显,这已经成为限制NASTRAN性能发挥的主要瓶颈因素,所以提高I/O带宽可以最为有效的提高NASTRAN的计算性能。
今年8月,INTEL官方确认其7系主板已经实现固态硬盘RAID 0 TRIM,这是一个令人十分振奋的技术!该技术可以使外设I/O带宽实现跨量级式的增长。传统HDD的平均带宽只有100MB/s左右,而现有SSD已经达到500MB/s左右,若将两个SSD组成RAID 0,将可实现1GB/s的外设I/O带宽(很多实际评测均能得到该结论),也就是说外设I/O带宽的短板将可实现10倍的增长,初步估算隐式有限元分析类软件的计算效率也可实现10倍左右的增长(有待在实际平台进行测试)。
基于上述分析,列出了下述PC机硬件配置单:
配件名称 | 数量 | CPU | INTEL I7-3770K @3.5GHz / 3.9GHz | 1 | 散热器 | 九州风神 GAMER STORM 阿萨辛 | 1 | 主板 | GIGABYTE GA-Z77X-D3H (rev. 1.1) | 1 | 内存 | G.Skill DDR3 1600 8G*2 套装 (F3-12800CL10D-16GBXL) | 2 | 显卡 | 集成Intel HD Graphic 4000 | —— | SSD | 威刚XPG SX910 128G | 1 | 威刚XPG SX910 256G | 2 | HDD | WD 1TB 7200转 64MB SATA3 蓝盘(WD10EZEX) | 1 | 光驱 | ASUS DVD-RW | 1 | 电源 | Antec VP 550P | 1 | 机箱 | 游戏悍将特种部队阿尔法战争版 | 1 | 显示器 | 三星S19A330BW | 1 | 目前该配置总价有点小贵,大概9800左右,再配置一块独立显卡就得过万了。下面对该配置进行详细说明:
1. 主要设备的主要技术指标:
1.1 中央处理器(CPU)
处理器名称: Intel Core I7 3770K
架构名称: Sandy Bridge
核心代号: Ivy Bridge
核心数量: 四核心
线程数: 八线程
主频: 3.5GHz
最大睿频: 3.9GHz
基准频率(BCLK)(外频): 默认100MHz (不建议超外频)
CPU倍频: ×35(默认)/×39 (最大睿频)(倍频可以超到×45,此时主频为4.5GHz)
(QPI总线时钟频率:2500MHz;QPI传输速率:5.0GT/s;QPI总线带宽20GB/s)
总线类型: DMI 2.0总线
总线频率: 5.0GT/s
DMI 2.0总线带宽: 20Gbps (2.5GB/s)
内存控制器: 双通道DDR3 1333/1600(双通道为128bit,则1600MHz时带宽为25600MB/s = 25.6GB/s;可以超到2133MHz,此时带宽为34133MB/s = 34.1GB/s)
支持最大内存: 32GB
L1: 4×32/4×32KB;
L2: 4×256KB;
L3:8192KB
1.2 主板(Motherboard)
SATA-Ⅲ接口带宽: 6Gbps= 750MB/s
DMI总线带宽:2.5GB/s (主要用于支持SSD与HDD等设备)
1.3 外部存储设备:
a) 设备1:
名称:ADATA XPG SX910 (128 GB, SATA-Ⅲ)
设备类型: SSD固态硬盘
格式化容量:128 GB
最大内部数据传输速率:读550MB/s写520MB/s(最大内部传输速率为机械硬盘的5倍,且随机读取性能更强)
接口类型:SATA-Ⅲ
接口传输速率:750 MB/s
b) 设备2、3
名称:ADATAXPG SX910 (256 GB, SATA-Ⅲ)
设备类型:SSD固态硬盘
格式化容量:256 GB
最大内部数据传输速率:读550MB/s写520MB/s(最大内部传输速率为机械硬盘的5倍,且随机读取性能更强)
接口类型:SATA-Ⅲ接口传输速率:750 MB/s
c) 设备4
名称:WDWD10EZEX (1TB, SATA-Ⅲ, 7200rpm)
设备类型: HDD机械硬盘
格式化容量:1TB
最大内部数据传输速率:110MB/s
接口类型:SATA-Ⅲ
接口传输速率(缓存到主机传输速率):750 MB/s
缓存大小:64MB
2. 初步性能估计:
2.1 外部存储设备数据传输性能估计
a) 设备2与设备3:
双SSD固态硬盘经由同一个控制芯片所提供的两个SATA-Ⅲ接口组成RAID 0,开启TRIM,数据传输速率可达1GB/s的高速, 是一般机械硬盘的10倍。将NASTRAN软件的STRACH路径及计算bdf文件路径指定到该盘。
b) 设备1与设备4:
设备1作为系统盘,安装系统及NASTRAN软件,其数据传输速率可达500MB/s。这样与上述阵列一起传输速率总共可以达到1.5GB/s的带宽,已经接近DMI 2.0总线带宽2.5GB/s。同时软件路径与工作路径分布在两个盘里更可充分发挥硬件性能。设备4作为数据仓储盘,其数据传输速率为110MB/s,可满足结果转存需求。 在上述配置中,外部存储设备I/O性能约为现有机器的10倍。
2.2 CPU性能估计
I7-3770K在默认频率下运算速度大概为28000千步每秒,在睿频下运算速度大概为31200千步每秒, 超频到4.5GHz后运算速度大概为36000千步每秒。同时,由于I7-3770K的架构更为先进,其QPI总线与FSB总线相比除了带宽有2倍以上的优势外,各个核心之间不再通过内存共享信息而是直接点对点通信。虽然超线程技术对NASTRAN来说用处不大,但是三级缓存比I5-3570K多了2MB,这个还是会稍微提升些性能的。况且不排除这台机器进行其他软件的计算,这种配置也为其他显式类型的计算做好铺垫。
2.3 内存性能估计
双通道DDR3 1333内存带宽为21.3GB/s。而双通道DDR3 1600内存带宽为25.6GB/s,且超频到2133MHz时,其带宽为34.1GB/s。
综上所述,与外部设备I/O相关的计算部分,计算性能提高约10倍。而NASTRAN计算中主要消耗时间的计算部分都是通过与外部设备进行I/O完成的,与外部设备进行I/O占据了计算的大部分时间。故上述配置总体性能提高约为机械硬盘的10倍。当然这些都是基于I/O为短板这一假设下得到的结论,还有待基于实际平台测试才能检验这一估算是否准确。
|
评分
-
1
查看全部评分
-
|