Benchmark性能评估

cx5, 和cx5 socket direct 不通节点数BiFrost性能对比, mpirun-np 512 -bind-to core -report-bindings -mcacoll_hcoll_enable0 -x

应用介绍

–OS:Red Hat 7.5

–Driver: MLNX_OFED 4.4.1–

Compilers:Intel compilers 2018.3.222

–MPI:HPC-X v2.2

–Application Version: BiFrostv1.1

–Test case:CFD on 64x64x64 box/core

–IO Type:Lustre

–Metric:Application

-reported elapsed time, Mz/s

image.png

mpirun-np 512 -bind-to core -report-bindings -mcacoll_hcoll_enable0 -x UCX_MAX_EAGER_LANES=2 -x UCX_MAX_RNDV_LANES=2 -x UCX_NET_DEVICES=mlx5_2:1,mlx5_4:1 -mcabtl_openib_if_includemlx5_2:1,mlx5_4:1 -x MALLOC_MMAP_MAX_=0 -x MALLOC_TRIM_THRESHOLD_=-1 ~/Bifrost_bench_v1.1/RUNS/photo_tr.x.hpcx-2.2.0

文件列表(部分)

名称 大小 修改日期
BiFrost_AMD_Aug2018(1).pdf397.88 KB2020-05-27

立即下载

相关下载

[一种ARM处理器面向高性能计算的性能评估] 为探索ARM 架构在高效能“绿色计算”领域中,面向高性能计算的应用价值,对一款ARM 指令集处理器进行性能评估,并将其与主流商用处理器Intel Xeon 进行性能对比。在微架构上,测试了该处理器的浮点数计算能力、访存带宽及延迟。
[Benchmark性能评估] cx5, 和cx5 socket direct 不通节点数BiFrost性能对比, mpirun-np 512 -bind-to core -report-bindings -mcacoll_hcoll_enable0 -x

评论列表 共有 0 条评论

暂无评论

微信捐赠

微信扫一扫体验

立即
上传
发表
评论
返回
顶部