We use a recurrent network to generate the model descriptions of neural networks and train this RNN with reinforcement learning to maximize the expected accuracy of the generated architectures on a validation set.
本文提出了Neural Architecture Search (NAS)——使用一个循环神经网络(Controller RNN)作为控制器,通过强化学习(REINFORCE策略梯度)来生成和优化神经网络架构。不需要任何人类专家的先验知识,NAS从零开始搜索,就能在CIFAR-10上设计出媲美甚至超越人类最优设计的网络结构。
除了CNN,NAS还成功搜索出了全新的Recurrent Cell,在Penn Treebank语言建模任务上超越了经典的LSTM单元。
2016年,深度学习在图像识别(ImageNet)、语音识别、自然语言理解等领域已经取得巨大成功。但一个残酷的现实是:设计好的神经网络架构极度依赖人类专家的直觉和经验。研究人员需要经过数月甚至数年的试错才能提出比现有方案更好的架构。
这种"架构工程"是手工的、低效的、不可扩展的。与此同时,我们却看到:
既然架构可以表示为序列,为什么不训练一个RNN来生成这个序列,再用RL来优化它?这就是NAS的诞生——把架构设计从"手工匠人"升级为"自动化流程"。
论文使用一个循环神经网络(Controller RNN)来"描述"一个神经网络架构。Controller逐时间步通过softmax分类器输出预测,每个预测对应架构的一个超参数:
重复上述过程,逐时间步生成多层卷积网络。每层预测的结果作为下一时间步的输入。
Controller RNN 的参数记为 θc。生成的架构在验证集上的准确率 R 作为奖励信号。使用策略梯度(REINFORCE算法)来更新Controller:
如果一个架构的准确率高于历史平均水平(R - b > 0),它对应的梯度权重为正(鼓励);反之则为负(抑制)。
单纯的卷积层堆叠表达能力有限。论文引入了Skip Connection(跳跃连接)机制,让Controller能够学习到层间的跨层连接:
除了CNN架构,论文还展示了NAS可以搜索循环神经网络单元(RNN Cell)。Controller通过树形结构生成计算图:
NAS的计算开销极大——每个采样到的架构都需要训练到收敛才能评估其性能。论文的解决方案是大规模分布式并行训练:
800个GPU同时训练800个子网络——Controller异步收集它们的验证准确率并更新策略。每批处理800个架构采样,使得收敛速度大幅提升。
NAS从零开始搜索,在CIFAR-10上达到 3.65% 测试错误率,比此前最好的人类设计架构还低0.09%。这是第一次自动搜索的架构在图像分类上超越人类专家设计。
NAS搜索到的Recurrent Cell在词级PTB上达到 62.4 Perplexity,比LSTM和其他手工设计单元低3.6。更重要的是,这个Cell可以迁移到字符级语言建模任务,同样取得SOTA(1.214 PPL)。
这篇论文定义了NAS的基本范式——"搜索空间 + 搜索策略 + 性能评估"的三元组框架,是整个人工智能自动化(AutoML)领域的里程碑。
截至2026年,这篇论文已被引用 6000+ 次,开启了AutoML和自动化架构设计的全新研究领域。它最核心的启示是:
与其手工设计架构,不如设计搜索架构的策略。这个思路贯穿了整个AutoML领域,也是当前LLM驱动的神经网络搜索(LLM+NAS)等前沿方向的根基。