EN
/news/show.php/video/49635347.html

[计算机视觉]特征集成了12种经典的魔法改变方法,包括配套模型和代码

2025-06-24 12:33:55 来源: 新华社
字号:默认 超大 | 打印 |

文章目录。

  • 一、Densenet。
  • 二、Resnet。
  • 三、CBP。
  • 四、SENet。
  • 五、GCNet。
  • 六、DANet。
  • 七、PANet。
  • 八、FPN。
  • 九、ASPP。
  • 十、SPP-net。
  • 十一、PSP-net。
  • 十二、ECA-Net。

特征融合(Feature Fusion)是深度学习中的一项重要技术,它可以帮助模型更好地理解数据的内部结构和规律,提高模型的性能和泛化能力。另外,特征集成还可以提高模型的分类精度,减少过拟合风险,帮助我们更好地利用数据集。

现有的特征融合方法取得了显著进展,但仍有一些挑战和问题。为了进一步探索新的特征融合方法,为了更好地解决上述问题,研究人员提出了许多优秀的魔法改革方法。

一、Densenet。

论文:Densely Connected Convolutional Networks。

卷积网络密集连接。

方法简介:Densenet是一种连接方式不同的卷积网络。在Densenet中,每一层都直接连接到所有其他层󿼌这使得信息传递更加直接和高效。相比之下,,传统的卷积网络只有相邻层之间的连接。densenet有多少优点:可缓解梯度消失问题,增强特征传播󿀌鼓励特征重用󿀌而且所需参数较少。在四个不同的基准任务上,Densenet的表现超过了现有技术,它需要更少的计算资源。

在这里插入图片描述

二、Resnet。

论文:Deep Residual Learning for Image Recognition。

深度残差学习用于图像识别。

方法简介:论文介绍了深度残疾学习框架,它使深度神经网络更容易训练。将层学习为相对于输入的残差函数,而不是无参考函数,该框架使深度网络更容易优化,并且可以从增加的深度中获得更高的准确性。Imagenet数据集,这种深度残差网络的性能非常好,而且比以前的网络更深。另外,该网络在其他比赛任务中也获得了第一名。

在这里插入图片描述

三、CBP。

论文:Compact Bilinear Pooling。

紧凑型双线性池化。

方法简介󿄚双线模型在许多视觉任务中都有很好的效果c;但特征维度高不实用。论文提出了两种低维双线性表达,和以前一样有效,但是只有几千维度󿀌更适合后续分析。这种表示可以使误差反向传播󿀌优化整个视觉识别系统。通过对双线性池化的创新分析,作者得到了这样的表达,它为研究其他紧凑型池化方法提供了新的思路。实验证书�这种表示对图像分类和小样本学习有效。

在这里插入图片描述

四、SENet。

论文:Squeeze-and-Excitation Networks。

挤压和激励网络。

方法简介:挤压和激励网络是卷积神经网络的关键部分,它通过挤压和激励来调整网络中的信息流。挤压操作提取网络中的空间信息,激励操作根据这些信息调整网络中的通道权重。这种网络结构可以有效地提高网络性能,特别是在处理图像分类等任务时。挤压和激励网络可与现有最先进的CNN结合使用,为实现更高的性能提升。

在这里插入图片描述

五、GCNet。

论文:Global Context Network。

全局上下文网络。

方法简介:Non-Local Network 是一种可以捕捉图像中长距离依赖性的方法,但是它的整体上下文对不同的查询位置都是一样的。所以,作者创建了一个更简单的网络,它基于查询无关公式,保持了 Non-Local Network 准确性,但是计算量较小。另外,作者也得到了改进 Non-Local 块的转换函数,用两层瓶颈代替原来的一层,参数数量进一步减少。由此产生的全局 上下文 (GC) 块可以轻量级有效模拟全局上下文,并可应用于主干网络的多层次,形成全局 上下文 网络 (GCNet)。

在这里插入图片描述

六、DANet。

论文:Dual Attention Network for Scene Segmentation。

双注意力网络用于场景分割。

方法简介:论文提出了一种叫做双注意力网络(的论文;DANet)新网络,用于解决场景分割任务。DANet通过两个注意力模块,首先,位置注意力模块,二是通道注意力模块,捕捉上下文依赖关系的丰富性。这两个模块分别关注空间维度和通道维度的依赖性。DANet可以自适应地整合局部特征和全局依赖关系,从而提高特征表达能力󿀌得到更准确的分割结果。

在这里插入图片描述

七、PANet。

论文:Path Aggregation Network for Instance Segmentation。

路径聚合网络用于实例分割。

方法简介:论文提出了PANet网络,用于改进基于提议的实例分割框架的信息流。PANet通过自下而上的路径增强来增强整个特征水平,在较低层次获得准确的定位信号,从而缩短了信息路径。还提出了自适应特性池化,连接特征网格和所有特征级别的提议子网络,使各特征级别的有用信息能够直接传播到后续的提议子网络。另外,还创建了一个互补的分支,以捕捉每个提议的不同视图#xff0c;进一步提高掩膜预测。这些改进很容易实现,而且几乎没有额外的计算费用。

在这里插入图片描述

八、FPN。

论文:Feature Pyramid Networks for Object Detection。

金字塔网络用于目标检测。

方法简介:特征金字塔是检测不同尺度物体识别系统的基本组成部分。然而,最近的深度学习目标检测器避免了金字塔表示,部分原因是它们的计算和内存密集。本文利用深度卷积神经网络固有的多尺度、金字塔层次结构,特色金字塔是以边际额外成本建造的。结合从上到下的架构和侧向连接,高级语义特征图可以在所有尺度上构建。这种架构称为特征金字塔网络(FPN),作为一种通用特征提取器,在几个应用中表现出显著的改进。

在这里插入图片描述

九、ASPP。

论文:DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs。

语义图像分割采用深度卷积网络、稀疏卷积和全连接CRF。

方法简介:论文提出了Deeplab系统,用于解决语义图像分割任务。主要贡献有三点:首先,强调稀疏卷积(Atrous Convolution)#xff0在密集预测任务中的重要性c;它允许控制特征响应的计算分辨率,有效地扩大滤波器的视野;二是,提出稀疏空间金字塔池化(ASPP),多尺度稳定分割对象;最后,方法࿰结合DCNS和概率图模型c;提高对象边界的定位精度。

在这里插入图片描述

十、SPP-net。

论文:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition。

深度卷积网络中用于视觉识别的空间金字塔池化。

方法简介:现有的深度卷积神经网络(CNN)需要固定大小(例如,224x24)输入图像,论文为网络配备了另一种池化策略——“空间金字塔池化”,消除上述要求。这种新的网络结构称为SPP-net,可生成固定长度的表示,而不考虑图像的大小/比例。金字塔池化对物体变形具有鲁棒性。因为这些优点�SPP-一般来说,基于CNN的图像分类方法应该改进net。

在这里插入图片描述

十一、PSP-net。

论文:Pyramid Scene Parsing Network。

⽤语义分割⾦识别字塔场景⽹络。

方法简介:场景识别是一项具有挑战性的任务,由于它需要处理各种各样的场景和词汇。本文提出了一种新的方法,基于上下文的聚合和金字塔池化模块࿰使用不同区域c;以及金字塔场景识别网络(PSPNet),提高场景识别性能。这种方法可以有效地利用全局上下文信息,并产生高质量的识别结果。PSPNet提供了一个优越的框架,用于像素级预测任务。

在这里插入图片描述

十二、ECA-Net。

论文:ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks。

注意深度卷积神经网络的有效通道。

方法简介:本文介绍了Efficient Channel Attention (ECA)模块,该模块可以改善深度卷积神经网络(CNN)性能,同时保持较低的模型复杂性。这一点是通过避免维度降低和局部通道交互策略来实现的。与Resnet50相比,#xff0c;ECA模块的参数和计算较少,但是性能提高了2%以上。实验结果表明󿀌ECA模块在图像分类、目标检测和实例分割等任务中表现出更高的效率和良好的性能。

在这里插入图片描述

【我要纠错】责任编辑:新华社