首页

技术: 模拟电子; 单片机; 半导体; 电源管理; 嵌入式; 传感器; 最能打国产芯

应用: 汽车电子; 工业控制; 家用电子; 手机便携; 安防电子; 医疗电子; 网络通信; 测试测量; 物联网; 最能打国产芯

大学堂: 首页; 直播; 专题; TI 培训

论坛: 汽车电子; 国产芯片; 电机驱动控制; 电源技术; 单片机; 模拟电子; PCB设计; 电子竞赛; DIY/开源; 嵌入式系统; 医疗电子; 颁奖专区; 【厂商专区】; 【电子技术】; 【创意与实践】; 【行业应用】; 【休息一下】; 最能打国产芯

活动中心: 直播; 发现活动; 颁奖区

电子头条

参考设计

下载中心: 分类资源; 文集; 排行榜; 电路图

Datasheet: 最能打国产芯

[经验] 《机器学习算法与实现 —— Python编程与应用实例》神经网络的训练 - 反向传播算法

lospring 2024-8-4 23:49 楼主

在多层神经网络中有这样一个问题：最后一层的参数可以用这样的方式求解得到；隐层节点没有输出的真值，因此无法直接构建损失函数来求解。

反向传播算法可以解决该问题，反射传播自满其实就是链式求导法则的应用。

按照机器学习的通用求解思路，我们先确定神经网络的目标函数，然后用随机梯度下降优化算法去求目标函数最小值时的参数值。

取网络所有输出层节点的误差平方和作为目标函数：

其中，Ed表示是样本d的误差, t是样本的标签值，y是神经网络的输出值。

然后，使用随机梯度下降算法对目标函数进行优化：

随机梯度下降算法也就是需要求出误差Ed对于每个权重wji的偏导数（也就是梯度），如何求解？

观察上图，可发现权重wji仅能通过影响节点j的输入值影响网络的其它部分，设netj是节点j的加权输入，即

Ed是netj的函数，而netj是wji的函数。根据链式求导法则，可以得到：

上式中，xji是节点传递给节点j的输入值，也就是节点i的输出值。

对于的∂Ed/∂netj推导，需要区分输出层和隐藏层两种情况。

1、输出层权值训练

对于输出层来说，netj仅能通过节点j的输出值yj来影响网络其它部分，也就是说Ed是yj的函数，而yj是netj的函数，其中yj=sigmod(netj)。所以我们可以再次使用链式求导法则：

其中：

将第一项和第二项带入，得到：

如果令δj=−∂Ed/∂netj，也就是一个节点的误差项δ是网络误差对这个节点输入的偏导数的相反数。带入上式，得到：

将上述推导带入随机梯度下降公式，得到：

2、隐藏层权值训练

现在我们要推导出隐藏层的∂Ed/∂netj∂：

首先，我们需要定义节点j的所有直接下游节点的集合Downstream(j)。例如，对于节点4来说，它的直接下游节点是节点8、节点9。可以看到netj只能通过影响Downstream(j)再影响Ed。设netk是节点j的下游节点的输入，则Ed是netk的函数，而netk是netj的函数。因为netk有多个，我们应用全导数公式，可以做出如下推导：

因为δj=−∂Ed/∂netj，带入上式得到：

至此，我们已经推导出了反向传播算法。需要注意的是，我们刚刚推导出的训练规则是根据激活函数是sigmoid函数、平方和误差、全连接网络、随机梯度下降优化算法。如果激活函数不同、误差计算方式不同、网络连接结构不同、优化算法不同，则具体的训练规则也会不一样。但是无论怎样，训练规则的推导方式都是一样的，应用链式求导法则进行推导即可。

3、具体解释

然后，按照下面的方法计算出每个节点的误差项δi：

对于输出层节点i

其中，δi是节点i的误差项，yi是节点i的输出值，ti是样本对应于节点i的目标值。举个例子，根据上图，对于输出层节点8来说，它的输出值是y1，而样本的目标值是t1，带入上面的公式得到节点8的误差项应该是：

对于隐藏层节点

其中，ai是节点i的输出值，wki是节点i到它的下一层节点k的连接的权重，δk是节点i的下一层节点k的误差项。例如，对于隐藏层节点4来说，计算方法如下：

最后，更新每个连接上的权值：

其中，wji是节点i到节点j的权重，η是一个成为学习速率的常数，δj是节点j的误差项，xji是节点i传递给节点j的输入。例如，权重w84的更新方法如下：

类似的，权重w41的更新方法如下：

偏置项的输入值永远为1。例如，节点4的偏置项w4b应该按照下面的方法计算：

计算一个节点的误差项，需要先计算每个与其相连的下一层节点的误差项，这就要求误差项的计算顺序必须是从输出层开始，然后反向依次计算每个隐藏层的误差项，直到与输入层相连的那个隐藏层，这就是反向传播算法的名字的含义。当所有节点的误差项计算完毕后，就可以根据式5来更新所有的权重。

以上就是反向传播算法的一个求解过程，整个过程也是搬抄其它大佬的结果，希望对大家有点帮助。

点赞

回复评论

暂无评论，赶紧抢沙发吧

最新活动

报名直播赢【双肩包、京东卡、水杯】| 高可靠性IGBT的新选择——安世半导体650V IGBT

30套RV1106 Linux开发板（带摄像头），邀您动手挑战边缘AI~

安世半导体理想二极管与负载开关，保障物联网应用的稳健高效运行

免费申请 | 上百份MPS MIE模块，免费试用还有礼！

PI 电源小课堂|无 DC-DC 变换实现多路高精度输出反激电源

2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中

随便看看

Window Mobile 手机驱动的问题

lpc4357软硬件平台方案(技术转让)

控制大功率电磁阀门 24V。可控硅用的有错吗？

实时操作系统VxWorks

关于 volatile

想学习怎样修理音响吗？----自做功放板

屏闪有水波纹问题

【SAMR21新玩法】16. 图形编程和代码编程切换

【米尔MYC-JX8MPQ评测】+ 开箱点屏

抢答：51里怎样用pwm产生正弦信号？

80元的LQFP48封装四轴SPI运动控制芯片手册

iar 内嵌汇编问题

MSP430的AD采集程序

EMC干扰问题

南华大学黄智伟系列- 注意设计总结报告有几十分，不能丢啊！！！

请问中国有没有专门的linux廉价PC卖啊？

STM32L073 Nucleo-64 上手简单评测

优化电源管理功能-BIOS优化

物联网是机遇？还是泡沫？

电子工程世界版权所有京B2-20211791 京ICP备10001474号-1

京公网安备 11010802033920号

写回复