2025年3月18日,基于开源KTransformers架构的 CPU/GPU 异构推理能力,沐曦在曦云C500单卡GPU上成功实现DeepSeek-R1-671B满血版单并发解码吞吐16.5 tokens/s的优异成绩,相比社区官方数据提升20%以上。

图片来源:沐曦Meta公众号

相比国际高端GPU八卡满血版部署方案,本项目在单并发性能上具有极高的性价比。

图片来源:沐曦Meta公众号

沐曦和KVCache.AI团队合作,通过对KTransformers模型框架进行细致的分析和调整,团队成功达成了曦云C500与KTransformers的无缝对接,为进一步性能优化奠定了坚实的基础。

更多相关信息

  • 普超新闻 | 普超资本荣膺财联社年度先锋投资机构、创始合伙人李立伟荣膺年度杰出投资人

  •   极佳视界:完成10亿元Pre-B轮融资

  • JBD显耀显示:推出车规级MicroLED投影平台“狮鹫”,开启人车交互新体验