[聚合文章] [Paper Reading - 1]Neural Architecture Search With Reinforcement Learning

软件架构 2017-12-19 15 阅读
图1

如图一,左边递归网络(控制器)给出一个网络结构,该网络结构的概率为P。右侧,对这个网络结构进行训练,并在验证集上进行测试,得到精度为R。这时,将R反馈给左侧控制器,通过强化学习更新控制器的参数,使得控制器对R大的网络结构给出更大的概率。

2.相关工作

文中提到,当前有些方法也进行相应的研究,但是他们只能在固定长度的空间中搜索。而用贝叶斯的方法,可以搜索可变长度的空间,但是泛化能力和灵活性没有本文的好。

3.方法

注:本文内容来自互联网,旨在为开发者提供分享、交流的平台。如有涉及文章版权等事宜,请你联系站长进行处理。