找回密码
 注册
Simdroid-非首页
查看: 557|回复: 13

[综合] 请教关于ansys并行计算加速比的问题

[复制链接]
发表于 2007-5-21 16:42:01 | 显示全部楼层 |阅读模式 来自 重庆
很多关于结构计算加速比的演示报告性能都很好,一般在16cpu以下都可以达到50%左右
但我从一篇资料上(附件)上提到只能达到20-30%,最近用ibm的p575服务器时也得到类似的结果
迷惑中,请假下各位通常情况下的实际加速比应该是多少才对

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
发表于 2007-5-24 09:34:54 | 显示全部楼层 来自 上海

回复 #1 silver79 的帖子

Simdroid开发平台
软件的并行性能不但跟求解器有关,还和问题的规模、类型有很大关系。规模越大并行效果越好,显示计算比隐式计算并行效果要好得多。如果算法需要进行大量的磁盘读写,那么硬盘速度将成为瓶颈,多机并行将受网络传输速度的影响。上海超级计算中心的硬盘为万转的SCSI硬盘,网络为光纤高速网络,所以并行计算性能要更好一些。

[ 本帖最后由 shanget 于 2007-5-24 09:41 编辑 ]
回复 不支持

使用道具 举报

 楼主| 发表于 2007-5-25 11:47:48 | 显示全部楼层 来自 重庆
我又回去查了下机器的配置,应该不是硬盘转速的问题,测试的575也使用的是10k转的scsi硬盘
不过的确很有可能是 i/o的问题,我们的磁盘阵列scartch少了点,还有就可能是求解器的选择,
稀疏矩阵求解的加速性的确不太好,大模型还是amg或者其他分布式求解器效果更好点
呵呵,以前有个大概1000W自由度的项目本来打算送超算做的,可惜涉及保密性,就一直耽误了,
回复 不支持

使用道具 举报

发表于 2007-5-25 12:48:09 | 显示全部楼层 来自 上海
sparse求解还是在一个节点内效率比较好,如果要跨节点建议还是使用分布式求解器.
回复 不支持

使用道具 举报

 楼主| 发表于 2007-5-25 14:34:57 | 显示全部楼层 来自 重庆
嗯,不过好像单节点内部也能使用分布式求解器
就是不知道此时和sparse,jcg,amg等专供单节点使用的求解器比较起来,效率如何
回复 不支持

使用道具 举报

发表于 2007-6-12 12:50:53 | 显示全部楼层 来自 广东深圳
单节点内部应该还是共享式比分布式快吧,因为共享式可以直接读写内存,而分布式要不停地打包,解包,显然是要慢的。
回复 不支持

使用道具 举报

发表于 2007-8-8 11:41:41 | 显示全部楼层 来自 四川成都
关于楼主的问题,2楼回答了一方面,我的看法是,ansys的并行计算其实实际意义不大,原因在于对于一个问题的分析其真正耗费cup时间的部分其实是网格的划分、计算数据的读取以及后处理,通过硬盘来存储肯定不行(再快的硬盘也是慢的)真正现实起作用的还是单个节点内的内存增加更为合适(实际情况是每个节点一般能到2G就算不错了),对于楼主1000W自由度的算例恐怕大部时间都耗在数据读取上了,何谈加速比?
回复 不支持

使用道具 举报

 楼主| 发表于 2007-8-9 16:20:04 | 显示全部楼层 来自 重庆
使用的是单机多CPU的smp并行模式,物理内存配置为64g,计算中使用到的最大内存为30g左右,基本上可以实现完全的核内计算,应该不是内存不够的问题
另外好像目前的cae软件,其前处理部分基本上都还是不能并行,并行效率提高还是主要在solve阶段吧
回复 不支持

使用道具 举报

发表于 2007-8-13 15:32:06 | 显示全部楼层 来自 上海

想要线性加速吗?NX Nastran 和 LS-Dyna

目前有限元分析软件只有这两个软件可以达到线性加速。当然msc.nastran也可以,不过性价比没有NX Nastran高
回复 不支持

使用道具 举报

 楼主| 发表于 2007-8-14 08:51:39 | 显示全部楼层 来自 重庆
原帖由 joshua20011107 于 2007-8-13 15:32 发表
目前有限元分析软件只有这两个软件可以达到线性加速。当然msc.nastran也可以,不过性价比没有NX Nastran高



..........就目前而言NX Nastran 与msc nastran性能更大的区别是在前处理而不是求解部分,参加ugs的报告会,对方也只敢说自己能够大量节约前处理时间,而不敢说自己求解如何如何,ugs也就接手msc nastran源代码3年而已,对于一个以前没有搞过cae的公司如果说这么快就能完全吸收msc的技术并且在求解器上获得这么高的创新的话,那以前msc公司的研发人员全都可以跳河了

[ 本帖最后由 silver79 于 2007-8-14 08:53 编辑 ]
回复 不支持

使用道具 举报

发表于 2007-8-15 22:14:01 | 显示全部楼层 来自 四川绵阳
原帖由 silver79 于 2007-8-9 16:20 发表
使用的是单机多CPU的smp并行模式,物理内存配置为64g,计算中使用到的最大内存为30g左右,基本上可以实现完全的核内计算,应该不是内存不够的问题
另外好像目前的cae软件,其前处理部分基本上都还是不能并行, ...

赞同你的看法,目前cae软件就我看来的确前后处理基本不能并行,solve部分究竟如何,楼主应该比我更有发言权。
回复 不支持

使用道具 举报

发表于 2007-8-16 13:00:40 | 显示全部楼层 来自 上海

NX Nastran的求解速度和并行计算能力不容怀疑

UGS着重宣传前处理,建模速度快,这个是千真万确的.至于NX Nastran的求解速度和并行效果,这是具体技术细节,一般是给CAE专业人员讲的时候会讲到,而且还有实例.
美国联邦贸易委员会拆分msc.nastran的时候,有一个条款就是UGS公司可以任意雇用原来msc员工.因此有几十位原来nastran开发专家到了ugs公司,继续开发nx nastran.现在ugs公司nastran开发人员在美国有130多人,中国CAE研发中心有30多人来开发nastran.
从公司规模来讲ugs公司远远大于msc公司.ugs在CAE上的投入很大,因此软件开发速度要远远快于其他公司CAE产品
回复 不支持

使用道具 举报

发表于 2007-8-16 13:05:46 | 显示全部楼层 来自 上海

采用什么样的并行模式会达到线型加速效果

大家可能知道,并行方式有多机多CPU并行(DMP),和单机多CPU(SMP).说实话单机多CPU并行效果不是很理想,因为受到共享内存访问限制.
多机多CPU并行效果很好,这个是本人在64个CPU上测过的.nastran具有超强的多机多cpu能力.
NX Nastran 5的内存管理改进了原来msc的管理方式,现在在64位机器可以管理百万G内存,因此大规模问题也可以用64位机器,单cpu快速计算了.大大节约了硬件成本和软件成本
回复 不支持

使用道具 举报

 楼主| 发表于 2007-8-16 19:02:32 | 显示全部楼层 来自 重庆
原帖由 joshua20011107 于 2007-8-16 13:05 发表
大家可能知道,并行方式有多机多CPU并行(DMP),和单机多CPU(SMP).说实话单机多CPU并行效果不是很理想,因为受到共享内存访问限制.
多机多CPU并行效果很好,这个是本人在64个CPU上测过的.nastran具有超强的多机多cp ...


两种方法各有好处
单机多cpu最大的好处就是他的共享内存,而最大的劣势也是共享内存在CPU过多(至少也在16以上才会表现出来)时候带宽限制且成本会很高,但对于结构计算这到无所谓,受算法本身限制,隐式计算加速比4-8cpu加速比就收敛,显式计算最多最多到50cpu,兄台可以试试看,基本上你用64cpu和8cpu,计算时间的差别不会超过10%
多机多CPU建立的大型cluster系统的推荐设置一般是每个节点机器为单机2cpu配置,其对于流体计算很有优势,因为流体计算对于cpu更加敏感且cpu加速性可以到几百cpu,相对来说内存需求不是这么大

最典型的案例就是西工大的超算中心,先买了cluster系统,后来又买了单机多cpu的SMP系统(最近记性不好,购买的先后顺序可能不对)
回复 不支持

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|小黑屋|联系我们|仿真互动网 ( 京ICP备15048925号-7 )

GMT+8, 2024-3-28 22:28 , Processed in 0.068617 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表