/// FILTER MODE ACTIVE

#端侧模型

← ALL TAGS

【硬核工程】要在 10mW 内跑 AI?端侧模型的“瘦身”战争:量化、剪枝与 NPU 异构

11/27/2025

(专注移动端 SoC 能效架构与 AI 落地) 一、 摘要 (Abstract) 当 ChatGPT 在云端数据中心拥有数万张 H100 显卡、消耗着相当于一个小镇的电力时,移动端 AI 工程师正面临着截然不同的物理挑战。 我们没有无限的电网,只有一块容量受限的锂电池;我们没有强力的水冷...

#端侧模型#模型量化#剪枝#NPU