AUTOGATE是首个面向工业级RTL功耗优化的代理框架,旨在实现工作负载感知的时钟门控优化,适用于大型分层代码库。当前的细粒度时钟门控(FGCG)技术在降低动态功耗方面表现优异,但优化流程仍然高度依赖人工操作。现有基于LLM的RTL优化方法存在两个主要缺陷:一是无法处理跨越数百万周期的长波形轨迹,二是难以在保持正确性的同时将优化扩展到大型分层代码库。
AUTOGATE通过机器学习(ML)与LLM的协同设计,连接波形级分析和RTL重写。具体而言,我们设计了一种基于ML的聚类算法,将原始切换轨迹提炼为紧凑的结构化表示,指导LLM进行RTL重写。这种方法能够准确识别和应用时钟门控机会,而无需LLM直接处理原始波形数据。为了增强可扩展性,AUTOGATE采用分层多代理架构,将大型设计分解为可独立优化的模块,实现深层设计层次间的协调优化。
在多种设计上评估AUTOGATE,从小型RTL设计到大型工业级代码库。实验结果显示,相较于基线,AUTOGATE始终能够降低动态功耗。在小型设计套件中,AUTOGATE平均降低动态功耗49.31%。在工业规模设计中,对NVDLA和BlackParrot分别实现了19.34%和7.96%的动态功耗降低,在高度优化的专有生产设计中,最高可降低6.86%。
博主点评: AUTOGATE通过创新的ML-LLM协同设计,突破了传统时钟门控优化的局限,展示了在高效能和可扩展性之间的完美平衡,为工业界提供了一种新的解决方案,值得深入关注与探索。其在动态功耗降低方面的显著成果也显示了自动化工具在芯片设计中的巨大潜力。