HPC-X 2.7

应用介绍

Mellanox HPC-X 是一个综合软件包,其中包括MPI和SHMEM通信库。 HPC-X还包括各种加速程序包,以改善运行在这些库之上的应用程序的性能和可伸缩性,包括UCX(统一通信X),该程序可加速底层的发送/接收(或放置/获取)消息。 它还包括HCOLL,它可以加速MPI / PGAS语言使用的基本的集合操作。

为了满足科学研究和工程仿真的需求,超级计算机正以无懈可击的速度增长。随着超级计算机的大小从数千个处理器内核增加到数十万个,新的性能和可伸缩性挑战已经出现。过去,并行应用程序的性能调整可以通过分别优化其算法,通信和计算方面来轻松实现。但是,随着系统继续扩展到更大的机器,这些问题变得更加复杂,必须全面解决。集体通信执行全局通信操作以耦合系统中的所有进程/节点,因此必须尽快且高效地执行。实际上,大多数科学和工程应用程序的可伸缩性都受所采用的集体例程的可伸缩性和性能的约束。当前,大多数集体操作的实现都会受到极端规模的系统噪声的影响(系统噪声会通过放大集体进行过程中随机发生的小的OS中断的影响来增加集体操作的延迟。)此外,集体操作会消耗一个CPU周期的很大一部分,这些周期最好用于进行有意义的计算。 Mellanox Technologies通过将通信卸载到主机通道适配器(HCA)和交换机,解决了这两个问题,即CPU周期损失和性能受系统噪声影响而损失。 SHARP(可伸缩分层聚合和缩减协议)和CORE-Direct®(集体卸载资源引擎)的技术提供了可用于处理集体操作的最先进解决方案,从而确保了最大的可扩展性,最小的CPU开销,并提供了重叠通信的能力通过计算进行的操作允许应用程序最大化异步通信。此外,HCOLL还支持构建运行时可配置的分层集合体。 HCOLL利用硬件多播功能来加速集体操作。在HCOLL中,充分利用了“ ucx_p2p” BCOL形式的UCX点对点库的性能和可伸缩性。这使用户可以透明地并以最小的努力利用Mellanox硬件卸载。 HCOLL是一个独立的库,可以集成到任何MPI或PGAS运行时中。当前已将对HCOLL的支持集成到Open MPI 1.7.4及更高版本中。 HCOLL版本当前支持“ Allgather”,“ Allgatherv”,“ Allreduce”,“ AlltoAll”,“ AlltoAllv”,“ Barrier”和“ Bcast”的阻塞和非阻塞变体。


文件列表(部分)

名称 大小 修改日期
Nvidia® Mellanox HPC-X® Software Toolkit__11_15_2020.pdf382.36 KB2020-11-15

立即下载

相关下载

[磁耦合谐振buckss仿真] 无线电能传输技术可有效地解决电源接入问题,使充电过程便捷、安全,解决了传统依靠电导体直接进行物理接触的电源直接接触式输电模式所带来的插电火花、积碳、不易维护、易产生磨损,特别是在特殊环境下用电存在的安全隐患等问题。
[QT学习日记篇01(1)-QT界面初探- *.pro文件详解] Qt基础课程完结项目,完成一款小游戏并封装:翻金币游戏,通过点击金币进行翻面,让所有金币为同一面就游戏通过进入下一关。 过程中会使用前面学到的 “信号和槽”,“Qt图片资源显示”,“Qt播放音频”,“Qt绘图函数”,“Qt消息控件”等等知识。是一次前面所学知识的汇总。
[MMC模块化多电平换流器常用调制策略的对比分析] 在Matlab/Simulink环境下分别搭建了桥臂数量为6和10的两种调制方法的仿真模型,分析了模块数量与调制方法对输出的正弦电压的影响。
[svpwm同步调制] 同步调制下,通过把载波的频率固定为参考波频率的整数倍,同时固定两者的相位关系。通过这种方法可以消除3的倍数次谐波,并且通过适合pwm波正负半周期对称(N载波比取奇数),消除偶次谐波,总体同步调制所含谐波只为6k+1也就是5 7 11 13次谐波等。
[避雷器comsol仿真] comsol实现避雷器的电,磁,热仿真计算模型
[FPGA车牌识别代码

评论列表 共有 0 条评论

暂无评论

微信捐赠

微信扫一扫体验

立即
上传
发表
评论
返回
顶部