找回密码
 注册
Simdroid-非首页
查看: 1501|回复: 17

[综合] NASTRAN高性能计算PC机配置

[复制链接]
发表于 2012-12-28 15:22:57 | 显示全部楼层 |阅读模式 来自 黑龙江哈尔滨
本帖最后由 superuirui 于 2013-8-2 15:51 编辑

        本人之前一直考虑如何提高NASTRAN软件在PC机上的计算效率。基于这个目的,本人搜集整理分析了相关的软件及硬件问题,最后给出了一套用于NASTRAN计算的PC机配置。请大家拍砖时轻点O(∩_∩)O~

        CAE软件可以分为隐式有限元分析(IFEA)、显式有限元分析(EFEA)和计算流体动力学(CFD)三个子学科。下表中给出了CAE常用的应用软件,并列出这些软件的特点,包括并行方式和可扩展性。
CAE软件分类
应用软件
并行方式
可扩展性
隐式有限元分析
    (IFEA)
ABAQUS
pthreads
<8CPU
ANSYS
OpenMP,MPI
MSC.NASTRAN
pthreads,MPI
显式有限元分析
    (EFEA)
LS-DYNA
OpenMP,MPI
<64CPU
PAM-CRASH
OpenMP,MPI
RADIOSS
OpenMP,MPI
计算流体动力学
    (CFD)
FLUENT
MPI
<128CPU
STAR-CD
MPI
PowerFLOW
OpenMP,MPI
从上表中我们可以了解到CAE应用软件具有以下特点:
特点1:IFEA类应用软件(如ABAQUS, ANSYS和MSC Nastran)的可扩展性不是很好。当使用超过8个CPU来处理一个任务时,通常不会再有性能上的提升;  
特点2:IFEA类应用软件通常使用共享内存方式(pthreads或OpenMP)进行并行处理,其中ABAQUS不支持消息传递方式(MPI)的并行;  
特点3:EFEA类应用软件(如LS-DYNA, PAM-CRASH和RADIOSS)和计算流体动力学软件(如FLUENT, STAR-CD和PowerFlow)的扩展性相对较好;  
特点4:EFEA类应用软件和CFD软件以采用消息传递并行方式(MPI)为主。

        隐式属性特点决定了NASTRAN软件不具备很好可扩展性,而且NASTRAN对于超线程(Hyper-Threading,简称“HT”)技术的支持也不是很好(MSC建议对于具有HT技术的CPU,应将HT关闭以提高计算性能)。 所以对于隐式有限元分析类软件来说,计算单任务时,高性能PC机或者工作站也许是最好的选择,配置超过8CPU的平台没有太大必要。
        同时,根据本人以往的计算经验,NASTRAN计算时间主要消耗在I/O以及与I/O有关的计算模块上(当然具体的数据及证据还在收集整理中),这使得由传统机械硬盘数据传输带宽过低所引起的瓶颈效益变得特别明显,这已经成为限制NASTRAN性能发挥的主要瓶颈因素,所以提高I/O带宽可以最为有效的提高NASTRAN的计算性能。
        今年8月,INTEL官方确认其7系主板已经实现固态硬盘RAID 0 TRIM,这是一个令人十分振奋的技术!该技术可以使外设I/O带宽实现跨量级式的增长。传统HDD的平均带宽只有100MB/s左右,而现有SSD已经达到500MB/s左右,若将两个SSD组成RAID 0,将可实现1GB/s的外设I/O带宽(很多实际评测均能得到该结论),也就是说外设I/O带宽的短板将可实现10倍的增长,初步估算隐式有限元分析类软件的计算效率也可实现10倍左右的增长(有待在实际平台进行测试)。

基于上述分析,列出了下述PC机硬件配置单:
  配件名称  
数量
  CPU  
INTEL I7-3770K @3.5GHz / 3.9GHz
1
  散热器  
九州风神 GAMER STORM 阿萨辛
1
  主板  
GIGABYTE  GA-Z77X-D3H (rev. 1.1)
1
  内存  
G.Skill  DDR3 1600 8G*2 套装  (F3-12800CL10D-16GBXL)
2
  显卡  
集成Intel  HD Graphic 4000
——
  SSD  
威刚XPG SX910 128G
1
威刚XPG SX910 256G
2
  HDD  
WD 1TB  7200转 64MB SATA3 蓝盘(WD10EZEX)
1
  光驱  
ASUS  DVD-RW
1
  电源  
Antec VP  550P
1
  机箱  
游戏悍将特种部队阿尔法战争版
1
  显示器  
三星S19A330BW
1
        目前该配置总价有点小贵,大概9800左右,再配置一块独立显卡就得过万了。下面对该配置进行详细说明:

1.  主要设备的主要技术指标:
1.1  中央处理器(CPU)
处理器名称: Intel Core I7 3770K
架构名称: Sandy Bridge
核心代号: Ivy Bridge
核心数量: 四核心
线程数: 八线程
主频: 3.5GHz
最大睿频: 3.9GHz
基准频率(BCLK)(外频): 默认100MHz (不建议超外频)
CPU倍频: ×35(默认)/×39 (最大睿频)(倍频可以超到×45,此时主频为4.5GHz
(QPI总线时钟频率:2500MHz;QPI传输速率:5.0GT/s;QPI总线带宽20GB/s
总线类型: DMI 2.0总线
总线频率: 5.0GT/s
DMI 2.0总线带宽: 20Gbps (2.5GB/s
内存控制器: 双通道DDR3 1333/1600(双通道为128bit,则1600MHz时带宽为25600MB/s = 25.6GB/s;可以超到2133MHz,此时带宽为34133MB/s = 34.1GB/s
支持最大内存: 32GB
L1: 4×32/4×32KB;
L2: 4×256KB;
L3:8192KB
1.2  主板(Motherboard)
SATA-Ⅲ接口带宽: 6Gbps= 750MB/s
DMI总线带宽:2.5GB/s  (主要用于支持SSD与HDD等设备)
1.3  外部存储设备:
a)    设备1:
名称:ADATA XPG SX910  (128 GB, SATA-Ⅲ)
设备类型: SSD固态硬盘
格式化容量:128 GB
最大内部数据传输速率:读550MB/s写520MB/s(最大内部传输速率为机械硬盘的5倍,且随机读取性能更强)
接口类型:SATA-Ⅲ
接口传输速率:750 MB/s
b)  设备2、3
名称:ADATAXPG SX910  (256 GB, SATA-Ⅲ)
设备类型:SSD固态硬盘
格式化容量:256 GB
最大内部数据传输速率:读550MB/s写520MB/s(最大内部传输速率为机械硬盘的5倍,且随机读取性能更强)
接口类型:SATA-Ⅲ接口传输速率:750 MB/s
c)   设备4
名称:WDWD10EZEX (1TB, SATA-Ⅲ, 7200rpm)
设备类型: HDD机械硬盘
格式化容量:1TB
最大内部数据传输速率:110MB/s
接口类型:SATA-Ⅲ
接口传输速率(缓存到主机传输速率):750 MB/s
缓存大小:64MB

2.  初步性能估计:
2.1  外部存储设备数据传输性能估计
a)   设备2与设备3:
        双SSD固态硬盘经由同一个控制芯片所提供的两个SATA-Ⅲ接口组成RAID 0,开启TRIM,数据传输速率可达1GB/s的高速, 是一般机械硬盘的10倍。将NASTRAN软件的STRACH路径及计算bdf文件路径指定到该盘。
b)  设备1与设备4:
        设备1作为系统盘,安装系统及NASTRAN软件,其数据传输速率可达500MB/s。这样与上述阵列一起传输速率总共可以达到1.5GB/s的带宽,已经接近DMI 2.0总线带宽2.5GB/s。同时软件路径与工作路径分布在两个盘里更可充分发挥硬件性能。设备4作为数据仓储盘,其数据传输速率为110MB/s,可满足结果转存需求。        在上述配置中,外部存储设备I/O性能约为现有机器的10倍。
2.2  CPU性能估计
        I7-3770K在默认频率下运算速度大概为28000千步每秒,在睿频下运算速度大概为31200千步每秒, 超频到4.5GHz后运算速度大概为36000千步每秒。同时,由于I7-3770K的架构更为先进,其QPI总线与FSB总线相比除了带宽有2倍以上的优势外,各个核心之间不再通过内存共享信息而是直接点对点通信。虽然超线程技术对NASTRAN来说用处不大,但是三级缓存比I5-3570K多了2MB,这个还是会稍微提升些性能的。况且不排除这台机器进行其他软件的计算,这种配置也为其他显式类型的计算做好铺垫。
2.3  内存性能估计
        双通道DDR3 1333内存带宽为21.3GB/s。而双通道DDR3 1600内存带宽为25.6GB/s,且超频到2133MHz时,其带宽为34.1GB/s

        综上所述,与外部设备I/O相关的计算部分,计算性能提高约10倍。而NASTRAN计算中主要消耗时间的计算部分都是通过与外部设备进行I/O完成的,与外部设备进行I/O占据了计算的大部分时间。故上述配置总体性能提高约为机械硬盘的10倍。当然这些都是基于I/O为短板这一假设下得到的结论,还有待基于实际平台测试才能检验这一估算是否准确。


评分

1

查看全部评分

发表于 2012-12-28 21:34:58 | 显示全部楼层 来自 上海
Simdroid开发平台
本帖最后由 wwiiww 于 2012-12-28 21:49 编辑

恭喜开版,顺便请教下。NASTRAN如何设置,才能使用多CPU、多核?一般的静态、动态分析。谢谢
回复 不支持

使用道具 举报

 楼主| 发表于 2012-12-28 22:06:39 | 显示全部楼层 来自 黑龙江哈尔滨
wwiiww 发表于 2012-12-28 21:34
恭喜开版,顺便请教下。NASTRAN如何设置,才能使用多CPU、多核?一般的静态、动态分析。谢谢
...

http://forum.simwe.com/thread-1065219-1-1.html

点评

已经兼职3个版啦,不能再兼职啦。。。  发表于 2013-1-2 13:13
super总版,兼职一下HPC专区的版主吧,呵呵  发表于 2013-1-2 08:46
回复 不支持

使用道具 举报

发表于 2012-12-29 13:54:10 | 显示全部楼层 来自 天津
恭喜开版,我好好研究研究,现在我都不懂这些数据,太专业了,谢谢斑竹
回复 不支持

使用道具 举报

发表于 2013-3-10 19:11:12 | 显示全部楼层 来自 黑龙江哈尔滨
主板用Z77? 太浪费了 不如省几百块用B75 反正Z77多的扩张功能对于分析用不上  内存完全可以32G  固态硬盘我用的是INTEL 330系列的120G固态 整体性能比机械硬盘快5倍以上 我的CPU是XEON E3 1230 主板B75 内存32G
回复 不支持

使用道具 举报

 楼主| 发表于 2013-3-11 22:54:26 | 显示全部楼层 来自 哈尔滨工业大学
jzxy10497 发表于 2013-3-10 19:11
主板用Z77? 太浪费了 不如省几百块用B75 反正Z77多的扩张功能对于分析用不上  内存完全可以32G  固态硬盘 ...

Z77可以用两个SSD组成RAID 0,并且支持TRIM
回复 不支持

使用道具 举报

发表于 2013-3-19 18:13:28 | 显示全部楼层 来自 黑龙江哈尔滨
superuirui 发表于 2013-3-11 22:54
Z77可以用两个SSD组成RAID 0,并且支持TRIM

能买得起两个固态硬盘的不如单独买一个PCI-E 8X接口的阵列固态硬盘
回复 不支持

使用道具 举报

发表于 2013-5-25 12:48:17 | 显示全部楼层 来自 湖南娄底
顶起楼主。
回复 不支持

使用道具 举报

发表于 2013-7-7 22:12:03 | 显示全部楼层 来自 上海
不知道SAS硬盘在数据传输方面的性能如何
回复 不支持

使用道具 举报

 楼主| 发表于 2013-8-2 15:43:50 | 显示全部楼层 来自 黑龙江哈尔滨
jzxy10497 发表于 2013-3-19 18:13
能买得起两个固态硬盘的不如单独买一个PCI-E 8X接口的阵列固态硬盘

推荐一个型号吧 ,还没看到性价比好的PCI-E固体
回复 不支持

使用道具 举报

发表于 2013-10-31 19:14:50 | 显示全部楼层 来自 广东深圳
cocl2 发表于 2013-7-7 22:12
不知道SAS硬盘在数据传输方面的性能如何

SAS 相对固态来说是容量大  随机读取持续传输什么的 还是固态好。也不知道说的对不。
回复 不支持

使用道具 举报

发表于 2013-11-14 13:28:08 | 显示全部楼层 来自 江苏无锡
好专业,想配一个
回复 不支持

使用道具 举报

发表于 2014-5-2 14:56:45 | 显示全部楼层 来自 广东深圳
发现个人电脑的计算多数时间都卡在数据读写上了,CPU的计算速度反而是次要的了
回复 不支持

使用道具 举报

发表于 2014-8-4 18:08:34 | 显示全部楼层 来自 LAN
用marc软件隐式分析也可以这样配吗,速度能提上去吗,8核并行会快吗
回复 不支持

使用道具 举报

发表于 2014-8-8 22:21:54 | 显示全部楼层 来自 广东广州
长见识了,下次配机器要好好研究下。
回复 不支持

使用道具 举报

发表于 2014-12-16 16:37:34 | 显示全部楼层 来自 中国
您好,导师要求配一台进行FLENT计算的电脑,价格六千左右,望大神指教。
回复 不支持

使用道具 举报

发表于 2015-7-8 23:35:39 | 显示全部楼层 来自 重庆
我一直奇怪,不能用infiniband或者万兆来跑并行么?
回复 不支持

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|小黑屋|联系我们|仿真互动网 ( 京ICP备15048925号-7 )

GMT+8, 2024-3-28 19:01 , Processed in 0.051686 second(s), 16 queries , Gzip On, MemCache On.

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表