2025年3月18日,基于开源KTransformers架构的 CPU/GPU 异构推理能力,沐曦在曦云C500单卡GPU上成功实现DeepSeek-R1-671B满血版单并发解码吞吐16.5 tokens/s的优异成绩,相比社区官方数据提升20%以上。

图片来源:沐曦Meta公众号

相比国际高端GPU八卡满血版部署方案,本项目在单并发性能上具有极高的性价比。

图片来源:沐曦Meta公众号

沐曦和KVCache.AI团队合作,通过对KTransformers模型框架进行细致的分析和调整,团队成功达成了曦云C500与KTransformers的无缝对接,为进一步性能优化奠定了坚实的基础。

更多相关信息

  • 沐曦股份:获评上海市创新型企业总部

  • 极佳视界:斩获多项行业大奖,世界模型引领通用物理智能新阶段

  • 深开鸿:深广电与深开鸿,携手共建“开源鸿蒙+广电”产业新生态