问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

深度学习7. 卷积的概念

发布网友 发布时间:2024-10-19 15:05

我来回答

1个回答

热心网友 时间:2024-11-16 14:13

卷积来源于英文的Convolution,由“Con”代表积分,“vol”代表转、卷组成。

卷积是一种数学运算,广泛应用于信号处理和图像处理等领域,它以简洁的数学形式描述动态过程。

卷积的定义较为复杂,在卷积神经网络中可能不常用。设f和g为定义在实数域上的函数,它们的卷积f*g定义为:

(公式)

其中t为实数,[公式]为积分变量。

在离散形式下,若f和g为长度为n的向量,它们的卷积f*g定义为:

(公式)

其中k为整数,[i]表示向量f的第i个元素。

在卷积神经网络中,卷积操作是一种特殊的线性变换,卷积核(也称为滤波器)在输入数据上进行滑动,每次计算与卷积核重叠部分的点乘和。这种操作可以提取输入数据的局部特征,实现特征的共享和抽象,使得网络对输入数据的变化更加鲁棒和准确。

卷积核是一种可学习的滤波器,用于对输入图像进行特征提取。卷积核通常是一个小的二维矩阵,大小为[公式],其中k为正整数,称为卷积核大小。卷积核的值通常由神经网络自动学习得到。

卷积核的作用是提取输入数据的局部特征。在卷积操作中,卷积核可以识别输入图像中的不同特征,如边缘、纹理、角落等,从而提取更加高级的特征表示。通过使用多个卷积核,可以提取不同类型的特征,形成更加复杂的特征表示,进而提高模型的性能。

不同的卷积核可以实现不同的效果,常见的卷积核有:

卷积核的大小是卷积神经网络中的一个超参数,通常与输入数据的尺寸以及需要提取的特征的大小有关。在卷积神经网络中,卷积核的大小通常比较小,例如常见的卷积核大小为3或5,因为较小的卷积核可以更好地保留输入图像中的局部特征。

同时,卷积核的大小也需要根据卷积操作的步幅和填充等超参数进行选择。在后面例子中,卷积核大小为3,步幅为1,填充为1,即每次卷积操作会对输入图像中的[公式]的区域进行处理,并生成一个相同大小的卷积特征。填充的目的是为了保留输入图像的边缘信息,以避免在卷积操作中丢失像素。

需要注意的是,卷积核大小的选择需要根据具体问题进行调整,通常需要通过实验来确定最佳的超参数。

自定义的卷积函数接收两个参数:- image:输入图像;- kernel:卷积核

卷积使用valid卷积的方式,在进行卷积操作时,输出图像的尺寸会变小,计算公式是:(image_rows - kernel_rows + 1, image_cols - kernel_cols + 1)

程序使用两个嵌套的循环遍历输出图像的每个像素,并计算该像素对应的卷积结果。np.sum函数中的参数image对输入图像进行切片,矩阵会进行逐元素相乘(Hadamard乘积或元素级乘积)。image[row:row + kernel_rows, col:col + kernel_cols]和kernel的大小都是kernel_rows x kernel_cols,相乘结果返回一个相同形状的矩阵。

示例的卷积核是一个简单的边缘检测器,用于检测图像中的边缘。

这里加载一张灰度图:

程序输出结果如下:

输出结果:

生成单通道图像调用卷积(1)生成单通道图像torch.randn(1, 1, 28, 28)

下面用torch.randn(1, 1, 28, 28)来生成随机数的PyTorch函数,它返回一个大小为(1, 1, 28, 28)的张量。其中每个参数的具体含义如下:

(2)卷积层

nn.Conv2d是PyTorch中用于定义卷积层的类。代码nn.Conv2d(in_channels=1, out_channels=16, kernel_size=3, padding=1)表示创建一个卷积层对象conv_layer,参数的含义如下:

最终,可以通过调用conv_layer(input_data)来实现卷积操作,其中input_data是输入的数据,卷积操作的结果将作为函数返回值。

卷积后得到了1个批次、16个大小为$28\times28$的特征图。

加载灰度图像进行卷积操作

下面示例中,卷积结果[batch_size, channel,height,width]会进行降维操作,以便于可视化显示。最后会使用Image.fromarray,将数组转为图片显示出来。

原始图像:

输出:

对彩色图片卷积,输出1通道

对彩色图片进行卷积,要把输入通道数改为3,加载时选择RGB:

输入:

卷积结果:

输出3通道的卷积操作

输出:
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
圣斗士星矢正义传说攻略_圣斗士星矢正义传说新手攻略 圣斗士星矢正义传说怎么觉醒圣衣 圣衣玩法攻略 圣斗士星矢正义传说召唤石怎么获得 获取攻略一览 超市促销员手机上打卡迟到几分钟 在超市里打卡显示的公司是什么意思? 长鹿休闲度假农庄交通指南 求从容桂到长鹿农庄怎么坐车,详细,准确 形容神情的五字词语 女生内衣穿多久该扔掉 吴江离张家港有多远? 图像处理初学,一个灰度图像矩阵卷积一个滤波器,请问滤波器矩阵的长宽要... 关税是属于什么税种 关税属于什么税 这是我系统盘下AMD文件夹里的文件,请问这些文件有用吗,是不是只是些... 电脑怎么卸载AMD显卡驱动程序? 东顺瓷砖是贴牌的吗 步步惊心十阿哥 谁能帮我查贵州六盘水五码, An,AAA,Akey,Esn,Imsi,当面酬谢。三码也... 金菊是贴牌吗 税优健康险如何帮我们退税 飞鸽AAA是天津那个厂造的 qq密码什么都没有了,只记得注册时候身份证号码可以找回不? 密信用什么做最好 腊梅怎么样养才能开花 真实生活中,是不是真有黄飞鸿这个人的? 铸造工艺种类 真有黄飞鸿这个人吗? 吃什么食物对增长肌肉有帮助 捷油牌省油丸谁用过,请接触过的人帮忙回答,谢谢! 飙动力省油丸是什么东西 魔兽世界mop的商业技能要求多少人物等级? mop正在内测,目前多个小号... 楚雄陵园怎么样? 楚雄州民政局机构职能 amd文件夹可以删吗? 用脚踩指压板时是疼好还是不疼好 kylin中建模之后表名和字段能否改成小写 kylin中建模之后表名和字段能否改成小写 肾血流量概述 智能探针式流量计概述 不吃药不打针全靠指压板它真的有治病功效 谁在乎过我,谁把我当成真正的朋友签名 接亲玩的堵门小游戏 在Linux(centos)中使用源码安装pgRouting 在Linux(centos)中使用源码安装pgRouting 短期贷款期限系统固定为一年 踩趾压板对身体健康有好处吗 短期贷款期限在 领结婚证后还能婚检吗 还能免费吗 残疾赔偿金如何计算时间? 如何对残疾赔偿金年限计算