如果是多通道输入数据,是否依然存在矩阵乘法呢?

在之前的文章中(卷积神经网络中为什么会有矩阵乘法?),我们提到的情形是只有一个通道的输入数据,相应的,也就只有一个与之对应的kernel。如果是多通道输入数据,是否依然存在矩阵乘法呢?我们看下面的例子。
在这个例子中,有3个输入通道(rgb),每个通道有与之对应的kernel,此时的卷积运算并没有本质的变化,就每个通道而言,仍然是二维滤波器。将每个通道的输出结果对应元素相加即为多通道情形下的卷积结果。这里可以设置偏置(bias)。图中的偏置值为1。此时,输入为多通道,输出为单通道。
进一步扩展,如果每个通道有多个与之对应的kernel,会是什么情形呢?如下图所示。图中,每个通道有4个kernel。从而,最终输出有4个通道。输出每个通道的计算方式与上图保持一致。
基于以上两图,我们不难得出如下结论:
输入通道与kernel通道保持一致,例如上图中有3个输入通道和3个kernel通道。
输出通道个数与每个kernel通道内的滤波器个数一致,例如上图中每个kernel通道内有4个滤波器,故输出通道个数为4。
每个输出通道所包含的元素个数与滑窗个数一致。这再次证明多通道本质上与单通道的卷积运算是一致的。
现在,我们对输入通道数据进行重组,如下图所示方式。取出每个通道滑窗内的数据,排成一列,最终构成一个矩阵。
紧接着,将每个通道对应的kernel也进行重组,如下图所示方式。最终形成kernel矩阵。与输入通道数据重组不同的是这里将kernel系数按行排列,每个kernel通道内滤波器的个数决定了行数。
至此,输入数据和kernel系数都被重组为矩阵,重组的目的就是为了满足矩阵运算的需求,这样就可以按照矩阵乘法计算卷积运算了。


台积电3nm 2024成主流
数字电源设计与实现的技术问题
H160直升机是同类型直升机中最安静且在油耗方面最环保的直升机之一
电机额定功率 电机额定功率计算公式
人工智能赋能机器视觉 让3D视觉无所不在
如果是多通道输入数据,是否依然存在矩阵乘法呢?
紫光展锐CEO任奇伟:用 “芯” 助力5G改变社会
新能源汽车需要摇号吗_新能源汽车怎么摇号_新能源汽车摇号规则
磁性材料厂家知多少:国内外磁性材料厂家整理
JDK中java.lang.Arrays 类的源码解析
虹科干货 | 最简单实用的CANopen介绍,看完你就明白了(1)
TI推出业界速度最快的24位元类比数码转换器ADS1675,
OriginOS Ocean功能预览视频全面展示系统细节,创新交互方式夺人眼球
关于手机快充技术与锂电池保护元件
燃料电池组件的模块化方法,可降低电池制造成本
使用高频超声波的半导体单片清洗中的微粒子去除研究
航班管家荣获阿拉丁神灯奖“小程序行业最佳工具奖”
传AMD已开发两款ARM原型处理器,欲与苹果M1竞争
5G进入射频前端技术的发展前景分析
瑞萨电子推出多功能气体传感方案