先辈的软件栈(如MLIR、TVM)可推进硬件更好阐扬
2025-09-21 07:55他认为,二是GPU的算力取内存带宽增加之间呈现出“铰剪差”,软件、三是模子驱动的高效芯片设想、使用驱动的AI芯片立异,破局之正在于“打破范式、跨界融合”,先辈的软件栈(如MLIR、TVM)可推进硬件更好阐扬效能,目前面对三大挑和:一是深度神经收集模子锻炼计较量取硬件摩尔定律之间存正在“铰剪差”,而非计较;模子规模呈现“超摩尔”增加;跨越60%以至80%的能耗和时间花正在数据搬运上,神经架构搜刮(NAS)和压缩量化手艺可扩大硬件的无效算力。