AI 推理性能大提升:华为 UCM 技术开源,系统吞吐猛增 22 倍 UCM 以 KV Cache 多级缓存和推理记忆管理为中心,通过推理框架、算力、存储的三层协同,宣称可破解长序列推理效率低、成本高的难题,为企业提供更优的 AI 推理体验。 AI 新资讯行业资讯# AI推理# 华为AI# 华为开源 2天前77789