AMD宣布基于CDNA的Instinct MI100 GPU与NVIDIA A100相比,每美元的性能提高2.1倍

AMD宣布了其所谓的全球最快的HPC GPU,即基于CDNA架构的Instinct MI100。与第二代EPYC处理器搭配使用时,Instinct MI100可提供高达11.5 TFLOP的FP64计算性能。与NVIDIA A100 GPU相比,MI100预计将提供更高的每美元性能,并支持新的ROCm 4.0软件平台。

AMD宣布了基于针对机器学习(ML)和高性能计算(HPC)工作负载的新型CDNA架构的Instinct MI100。与第二代AMD EPYC处理器搭配使用时,MI100有望提供10 teraflops的FP64性能,最高可达11.5 TFLOPS。

在演示过程中,AMD还确认了代号为Milan的基于Zen 3的第三代EPYC处理器现在正在向某些OEM进行采样,并计划于2021年第一季度发布。

AMD表示,正在开发针对特定应用量身定制的不同架构,但有一些重叠之处。尽管RDNA可以满足游戏需求,但CDNA更加专注于计算和HPC应用程序。Instinct MI100提供了一种矩阵核心技术,该技术可实现单精度和混合精度矩阵运算,例如FP32,FP16,bFloat16,Int8和Int4。

MI100中的第二代Infinity Fabric在1.2 GHz时具有32 GB的HBM2内存,可提供1.23 TB / s的带宽。

下表说明了AMD Instinct MI100的规格:

设计全高,双插槽,10.5英寸长
计算单位120
流处理器7,680
FP64 TFLOP(峰值)11.5
FP32 TFLOPs(峰值)23.1
FP32矩阵TFLOP(峰值)46.1
FP16 / FP16矩阵TFLOP(峰值)184.6
Int4 / Int8 TOPS(峰值)184.6
bFLOAT16 TFLOPs(峰值)92.3
HBM2 ECC内存32 GB
记忆体介面4,096位
记忆体时钟1.2 GHz
记忆体频宽1.23 TB /秒
PCIE支持第四代
无穷结构链接/带宽3/276 GB /秒
技术开发计划300瓦
冷却被动冷却

尽管MI100的设计可与EPYC处理器很好地配合使用,但AMD确认新GPU也支持Intel处理器。总体而言,与上一代AMD HPC GPU相比,MI100预计可达到7倍的FP16性能。

本能MI100在CPU和GPU之间提供高达64 GB / s的Infinity Fabric带宽,而无需使用任何PCIe开关。共有3个Infinity Fabric链接,它们提供高达276 GB / s的吞吐量。本质上,MI100的四GPU配置单元可产生高达1.1 TB / s的总带宽。据AMD称,这些功能使MI100在FP16 / FP32负载方面领先于NVIDIA A100,同时还提供了更高的每美元性能(请参见下面的幻灯片)。

Instinct MI100支持新的ROCm 4.0生态系统,AMD将其视为针对ML和HPC工作负载的完整百亿亿解决方案。ROCm 4.0现在使用开源编译器,并支持OpenMP 5.0和HIP。此外,PyTorch和TensorFlow现在针对ROCm 4.0进行了优化。

预计到今年年底,戴尔技嘉惠普和超微等主要的OEM和ODM系统将采用AMD Instinct MI100。

声明:搞机网版权所有,如未注明转载均为原创,转载请注明出处!
本文链接:https://gaopc.cn/newsflashes/6907.html
本文标题:AMD宣布基于CDNA的Instinct MI100 GPU与NVIDIA A100相比,每美元的性能提高2.1倍
如有疑问:联系我们 | 给我投稿 | 分享你的快乐
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索