电子发烧友网归纳报导 音讯称
,特供NVIDIA正在为我国商场研制一款名为“B30”的芯片降规版。AI 。光没芯片 ,特供这款芯片将首度支撑多
。芯片GPU。光没扩展 ,特供答使用户经过衔接多组芯片来打造更高功用的芯片核算集群。B30芯片估计将选用最新的光没Bl。ac。特供kwell架构,芯片运用GDDR7显存,光没而非高频宽内存(HBM),特供也不会选用台积电的芯片先进封装技能。
不少人以为多GPU扩展才能指的光没是NVLink,但NVIDIA已在其消费级GPU芯片中取消了NVLink支撑,因而B30是否支撑NVLink现在还不能确认 。有音讯称B30芯片的多GPU互联功用或许根据NVIDIA的ConnectX-8 SuperNICs技能 ,这一技能曾在Compu
。te 。x 2025上展现
,用于衔接RTX Pro 6000 GPU。
NVIDIA ConnectX-8 SuperNIC是业界首款在单个设备中集成支撑 PCIe Gen6 的
。交换机
。和超高速网络的 SuperNIC 。ConnectX-8 专为现代 AI 根底架构规划,可提供更高的吞吐量,一起简化体系规划并进步功耗和本钱效益。
NVIDIA ConnectX-8 正在从头界说根据 PCIe 的体系的或许性
。经过将 PCIe Gen6 交换机和高功用 SuperNIC 集成到单个集成设备中,ConnectX-8 可简化服务器规划 ,削减组件数量
,并解锁现代 AI 作业负载所需的高带宽。通讯。途径 。然后打造更简略、更节能的渠道
,一起下降全体具有本钱 (TCO) 并完成超卓的功用可扩展性。
此外
,ConnectX-8 SuperNIC 还可在根据多 GPU 的渠道中完成增强的秘要核算才能
。
B30与H20存在功用差异 ,首要体现在几个方面
:1、显存技能差异,H20芯片选用HBM3显存,带宽高达4.0TB/s ,而B30芯片估计运用GDDR7显存,带宽或许降至1.7TB/s左右 。HBM3在带宽和能效比上显着优于GDDR7,特别在处理大规划数据集时
,H20的显存功用优势将更显着
。
2、互联技能比照 :H20支撑NVLink技能,卡间互联带宽高达900GB/s,合适构建大规划核算集群 。B30芯片的多GPU扩展功用或许依靠ConnectX-8 SuperNICs技能,而非NVLink ,其互联带宽和推迟或许不及H20
,在需求低推迟通讯的场景中体现或许受限
。
3、功用定位差异:H20芯片在FP8和FP16精度下的Tensor Core功用分别为296。 TF。LOPS和148 TFLOPS,适用于。高精度。核算使命。B30芯片作为降规版,单芯片算力或许低于H20,但经过多GPU扩展可提高全体功用,合适对本钱灵敏但需求必定扩展性的使用场景。
4、使用场景适配:H20芯片在垂类模型练习和推理使命中体现优异,特别合适需求高带宽和低推迟的场景。B30芯片则更侧重于经过多GPU扩展满意中小规划核算需求
,或许在性价比和灵活性上更具优势
,但单芯片功用或许无法与H20比美
。
与华为昇腾910等国产芯片比较
,B30系列在显存容量上占优