根据调研报告专家观点:⽬前的评估主要集中在推理侧,因为⽇均推理Token消耗量正接近10万亿规模。若以H20芯⽚为基准,⽀撑这⼀规模需要超过10万张卡的体量。然⽽,除了2024年底⾄2025年初到货的⼀批144GB版本的H20外,后续供应有限,因此国产化替代势在必⾏

根据腾讯最近对国产芯⽚的评测情况,在国产替代⽅案中,沐曦C500的表现较为突出,测试结果显示其综合性能⼤约能达到半张H20卡的⽔平。其他⼏款芯⽚的评估情况如下:昇腾910B不太理想,寒武纪思元590是⼀款算⼒密集型芯⽚,同样不适⽤于⼤规模推理任务。

壁仞BR100具备64GB显存和⾼达3.2TB/s的内存带宽,卡间互联带宽为512GB/s,性能不错,但其成本相对较⾼。

基于上述评估,如果进⾏采购,腾讯对这些国产推理芯⽚的明确采购优先级依次是:沐曦、海光、寒武纪系列。沐曦是目前中国最好的GPU。

更多相关信息

  • JBD显耀显示:推出车规级MicroLED投影平台“狮鹫”,开启人车交互新体验

  • 极佳视界:GigaWorld-Policy 正式亮相

  • 博雷顿:联手广州发展新能源集团,共建全球绿色矿山