栏目分类
热点资讯
你的位置:开云彩票(中国)官方网站 > 新闻中心 > 彩票游戏app平台MI325X也撑握八块并行构成一个平台-开云彩票(中国)官方网站
彩票游戏app平台MI325X也撑握八块并行构成一个平台-开云彩票(中国)官方网站
发布日期:2024-10-13 04:54 点击次数:71
快科技10月11日好意思国旧金山现场报说念:
在Advancing AI 2024大会上,AMD厚爱发布了新款GPU加速卡\"Instinct MI325X\"。
它在大获到手的MI300X基础上再进一步,主淌若增强了HBM内存部分。
【硬件规格、性能篇】
MI325X配备了多达256GB HBM3E内存,比较于MI300X又增多了64GB,如故八颗,但单颗容量从24GB增至32GB。
同期,带宽从5.3TB/s来到了6TB/s,一样增多了毛糙13%,Infinity Fabric总线的带宽则如故896GB/s。
性能方面倒是没啥变化,如故FP16 1.3 PFlops(每秒1300万亿次)、FP8 2.6 PFlops。
很当然的,中枢规格亦然邯郸学步:5nm XCD模块搭配6nm IOD模块,3.5D封装,1530亿个晶体管,304个狡计单位。
不外,AMD暴露MI325X的功耗达到了1000W,比较MI320X增多了750W。
MI325X也撑握八块并行构成一个平台,这就有多达2TB HBM3E、48TB/s带宽,总的性能高达FP16 10.4 PFlops(每秒1.04亿亿次)、FP8 20.8 PFlops(每秒2.08亿亿次)。
这个范围对比NVIDIA H200 HGX,分袂有80%、30%、30%的上风。
对比NVIDIA H200,岂论单卡如故八卡平台,不同大模子推理的性能都不错最初20-40%。
熟练性能方面,单卡可最初H200 10%,八卡平台则是握平。
MI325X加速卡和平台将在四季度内投产,而配联合伴的整机系统、基础架构惩办有贪图,将从来岁第一季度起讨好推出。
【生态伙伴、软件篇】
GPU加速器这么的居品要思到手,不但要有遍及的硬件规格与性能,致使更蹙迫的还有两点,一是生态配合,二是软件撑握。
生态方面,AMD Instinct系列的\"一又友圈\"贬抑壮大,最初的OEM整机厂商、云处事厂商、AI有贪图厂商都遴荐了AMD,那些咱们熟悉的行业巨头名字都在这份越来越长的名单中。
尤其是微软、OpenAI、Meta,都在部署越来越多的Instinct平台。
软件方面,AMD ROCm配置平台是一套齐备的AI软件堆栈,硬件之上,开动时、编译器、配置器具、库、AI框架、AI模子与算法一应俱全。
AMD ROCm的进化速率也在加速,新特点新功能贬抑加入进来,不但如故撑握沿途蹙迫的AI框架与模子,还在贬抑优化对生成式AI的撑握,包括新的算法、新的库等等,对配置者也越来越友好。
ROCm配置平台的性能也在贬抑优化升迁,最新的6.2版块对比6.0版块,不同大模子的熟练性能升迁了1.7-1.9倍,平均约1.8倍;推感性能更是升迁了1.9-2.8倍,平均约2.4倍。
这些都是无需升级硬件,都备靠软件优化得来的,不错说是\"白捡\"。
同期,AMD与配置者社区一直保握着直爽、深度的配合,亦然最大的孝顺者之一,尤其是在PyTorch机器学习库、Triton编程言语和编译器上提供了实时、全面的撑握。
AMD一直坚握洞开开源的原则,不但我方的诸多时间对外公开,还全力撑握着开源社区,贬抑壮打开源的力量。
以MI300X为例,上机无需任何调试适配,就能撑握跳动100万个生成式AI模子,尤其是第一时间撑握Llama 3.1/3.2等最初大模子的最新版块。
直爽的撑握虽然不单是是能用,更是好用,比如Llama 3 405B大模子上,MIX300X的蔓延比较NVIDIA H100有着1.2倍的最初。
顺带一提,AMD近期还以6.65亿好意思元的价钱,完成了对欧洲最大的私东说念主AI现实室Silo AI的收购,获取了全面的端到端AI惩办有贪图、约300名AI众人,例必会大大增强AMD在欧洲的AI业求实力,分析东说念主士以为有望越过NVIDIA。
附MI325X官方精采图赏——