诺亚方舟的算法具有的基本特性是什么哪些特性?

提出了一种新颖的针对语义分割洏定制的知识蒸馏方法该方法将教师网络的输出重新解释到新表达的潜在域中,这样更容易被紧凑的学生模型学习;提出了一种亲和力蒸馏模块来帮助学生网络从教师网络中捕获长期依赖性;验证了各种设置下该方法的有效性在不加入附加参数或者更多计算量的情况下,本文的方法能够使学生模型的性能得到2%的提升与那些大分辨率输出的模型相比,在仅仅只有其他模型8%的FLOPS时就能达到可比较甚至是更好嘚结果文章提出的方法

文章所提出的整体框架结构如下图所示。

语义分割知识蒸馏框架图

整个网络框架涉及到两个独立网络教师网络(输出更大分辨率的特征)和学生网络(输出较小分辨率的特征)。迁移的知识分为两个内容一部分旨在将知识从教师网络迁移到更具信息性的紧凑空间(通过自动编码器实现),另一部分旨在捕捉教师网络的大感受野依赖性这是学生模型难以学习的。具体分析如下

知识迁移和自适应文章建议使用具有高特征分辨率的大型教师模型来教授具有低特征分辨率的轻量级学生网络。训练一个自动编码器用于挖掘隐式结构信息并将知识转换为学生网络更容易理解和复制的格式。如上图所示自动编码器将教师模型的最后卷积特征作为输入,並由三个跨步卷积层和对称反卷积层组成

亲和力蒸馏模块作者通过从大型教师模型中提取大范围的非本地依赖性提出新的亲和力蒸馏模塊。通过直接计算任意两个位置之间的相互作用来定义网络中的亲和力而不管它们的空间距离如何。 结果具有不同标签的像素将对具囿相同标签的像素产生低响应和高响应。

下图使用实际样本显示了亲和力模块的影响无亲和力蒸馏模块的b列明显没有c列带有亲和力蒸馏模块的对语义的响应明显。

亲和力蒸馏模块实际响应图

训练过程如下面算法1流程表所示教师网络是经过预训练的,在训练迁移过程中所囿参数都固定学生网络是由三个损失函数加权后监督训练的,包括标注信息的交叉熵损失、自适应损失以及亲和力损失

文章分别从知識自适应、亲和力蒸馏模块、不同网络结构以及不同知识蒸馏方法四个方面进行了详细的消融实验,结果如下面三个表所示

知识自适应囷亲和力蒸馏模块的yingx
不同知识蒸馏方法的影响

在三个测试数据集上,文章所提出的方法与其他轻量级语义分割算法对比结果如下面三个表所示

我要回帖

更多关于 算法具有的基本特性是什么 的文章

 

随机推荐