根据调研报告专家观点:⽬前的评估主要集中在推理侧,因为⽇均推理Token消耗量正接近10万亿规模。若以H20芯⽚为基准,⽀撑这⼀规模需要超过10万张卡的体量。然⽽,除了2024年底⾄2025年初到货的⼀批144GB版本的H20外,后续供应有限,因此国产化替代势在必⾏。
根据腾讯最近对国产芯⽚的评测情况,在国产替代⽅案中,沐曦C500的表现较为突出,测试结果显示其综合性能⼤约能达到半张H20卡的⽔平。其他⼏款芯⽚的评估情况如下:昇腾910B不太理想,寒武纪思元590是⼀款算⼒密集型芯⽚,同样不适⽤于⼤规模推理任务。
壁仞BR100具备64GB显存和⾼达3.2TB/s的内存带宽,卡间互联带宽为512GB/s,性能不错,但其成本相对较⾼。
基于上述评估,如果进⾏采购,腾讯对这些国产推理芯⽚的明确采购优先级依次是:沐曦、海光、寒武纪系列。沐曦是目前中国最好的GPU。





