C++Bp神经网络

介绍

现将大部分原理从博客搬过来详细的代码讲解和运行结果说明太长还是请去我的博客查看：https://blog.csdn.net/weixin_43934607/article/details/100111813

描述部分

什么是BP神经网络

这个百度比较多就不赘述了在看到我的文章前一定也看了不少了!

开篇先说几点

本文是基于博客"https://blog.csdn.net/ironyoung/article/details/49455343"补充与拓展

本文努力去通俗的阐述bp神经网络原理与结合实际bp网络图重构其代码尤其核心算法部分让bp算法使用更清晰明了并且下面贴的代码注释非常全也给出了用的哪个具体计算公式很容易看懂

执行流程

正向：

反向：

算法原理

误差

"d"：输出值的正确结果 "o"：实际输出值 "k"：输出节点的个数（因为如果输出层节点不止一个时就把多个节点的误差相加）

该式子是输出层误差的进一步分解

"f(netk)"：是把输出层误差的"o"替换掉 "f(x)"：指激活函数本文用的"sigmoid"函数（激活函数通常不是自定有固定的函数去选择） "netk"：输入层从隐藏层取到并且还没有经过激活函数的值

第二个式子使把"netk"又进一步分解用隐藏层的值来表示

"j"：隐藏层节点数（本文用的单层隐藏层） "w"：隐藏层第j个节点对输出层第k个节点的加权 "y"：第j个隐藏层节点的值（该值是已经经过了激活函数的值）

综上：输出层一个节点未经过激活函数的值"netk" 就等于（隐藏层每个节点的值都乘其对输出层那个对应节点的加权）的和

该式子又是对隐藏层误差第二个式子的分解

"f(netj)"：是把“yj"替换掉了（"yj"指的隐藏层节点的值）换成输入层的值来表示 "i"：输入层的节点数 "v"：输入层第i个节点对隐藏层第j个节点的加权 "x"：输入层第i个节点输入的值

综上：隐藏层一个节点未经过激活函数的值"netk" 就等于（输入层每个节点输入的值都乘其对隐藏层那个对应节点的加权）的和

总结：

实际上每次往前一层都是分解该层未经过激活函数的值把该值用：（上一层每个节点的值*每个节点对该节点的加权）的和来替换不断向前扩大用前一层来替换
同时可以看到我们可以改变加权“w”、“v"来减小误差

bp神经网络是如何减小误差的

一.修改加权

1.如何修改隐藏层加权

修改的表达式

链式原则

"w7"：一个隐藏层的一个加权 "net"：输出层从隐藏层取到未经过加权的值 "out"：经过加权函数后的值 "Eo1"：o1节点的误差 "Etotal"：所有节点最终的误差和

根据上面的链式原则可以把式子变为
这就相当于

分别计算每个偏导

第一个偏导

因为：
相当于除了E(t1) 有"o1"其他都没有所以都被看作常数了（即：用E(t1)对out（o1）求导得该结果）

target指的是正确结果的值*

第二个偏导

该偏导就相当于对激活函数sigmoid得偏导所有使用sigmoid激活函数的 out对net的求导都是该值

第三个偏导

综上所得各个偏导的乘积

2.如何修改输入层加权

修改的表达式

链式原则

"w1"：输入层加权 "neth1"：隐藏层获取输入层且没经过激活函数的值 "outh1"：经过激活函数的值 "neto1"：输出层没加权的值 "outo1"：输出层经过加权的值也是最终输出结果 "Eo1"：o1节点得误差 o2同理...

可以看出输出层的加权影响的输出节点不止一个
根据上面的链写出下面表达式

"outh1"为分叉处所以用"Etotal"对"outh1"的偏导表示其之后所有的影响下面又把对"outh1"的偏导进行拆分分成两路

所以每次计算输入层偏导时要分成两部分来算

二.修改偏移

上面的bp图没有画偏移这又找了一个

b1和b2指的是偏移（即：在加到下一层的时候加权永远都是+1 但自己的值是改变的）

用o1的值举例偏移怎莫用注意：b1的值对o1、o2是不同的值一个节点有一个自己偏移值（输入层的节点都没有偏移值）最后再加上该值就是未经过激活函数的net值
要修改偏移的话同理用链式先画出影响的链再一步一步偏导（下面的代码中有实现和讲解）

其他减小误差的方法就不赘述了欢迎大佬补充

代码实现

一.神经网络图

这个图就是我们一会儿要解决xor问题的神经网络图：两个输入节点、一层隐藏层，且4个节点、一个输出节点

注意：

图中b1和b2指的是偏移每个节点只有一个该值用于从上一层获取到值之后加上该值所以隐藏层每个节点都有其不同偏移b1、输出层每个节点也有其不同的偏移b2（输入层节点都没有偏移）

net和out的区别是 net没经过激活函数但是已经加了偏移 out是net经过激活函数后的值图中写成out形式代表该节点的最终输出值

二.怎莫计算误差

因为我们要用代码实现的神经网络图只有一个输出节点所以这里的Etotal就是那一个输出节点的误差

三.怎莫计算改变量

怎莫计算反向传递时输出节点偏移的改变量

1）依然用上面说的链式的原则一直进行偏导就得到上面的结果 2）最后"*1"是因为"neto1"对"b2"的偏导时因为b2是偏移量直接相加所以偏移量对下一层的加权是1

怎莫计算反向传递时隐藏层节点加权的改变量

这里以w9进行举例其他加权做法相同

怎莫计算反向传递时隐藏层节点偏移的改变量

这里之所以用两个括号括起来因为虽然咱们实现的bp网络只有一个输出节点但是咱们在代码要遍历输出层的节点遍历的时候咱们并不知道有多少个输出节点所以用括号括起来

如果输出有多个节点参照上面的"如何订正输入层加权" 把第一个括号里的式子进行拓展

最后对b1偏导的结果是1的道理跟上面相同

怎莫计算反向传递时输入层节点加权的改变量

这里用w1进行举例其他加权求变化量原理相同

用括号括起来也是因为代码中遍历输出节点时不知道节点个数第一个式子会变成多个节点情况的和但实际只有一个

通过上面可以看到，输出层节点偏移量的改变值和隐藏层加权的改变值只是最后一个偏导不同，隐藏层节点的偏移量和输入层节点加权的该变量也只是最后一个偏导的值不同

四.有了变化量到底怎样更新该值

偏移更新的表达式同理

五.写代码前注意事项

在正向传播获取值时：在遍历当前层节点时遍历上一层节点（从隐藏层开始）
在反向传播获修改加权时：在遍历当前层节点时遍历下一层节点找到对应的加权

(该部分过长，包含了详细的代码注释还有运行运行训练结果说明，就不搬过来了，请去我的blog看吧！）

总结：

可以看出结果还是比较符合预期在两个数相差很小时的判断结果就很接近0 其余情况就很接近1
在进行调整时通过减少样本数提高误差的减小速度从而可以输入更低的误差但效果不是并很好所以就选择增加样本增大学习效率同时输入一个折中的误差似乎效果更好点
在设置训练数据的时候要尽量包含的范围段全一些可以大幅提高准确率但是训练数据如果设置的不太合理的话可能会导致训练时误差减少的特别慢最后训练次数可能达到最大值但也没到设置的误差阀值
在把误差从0.001降到0.0001之后训练次数也是大幅翻倍甚至达到250w+次但是准确率也明显提高每组结果都更加接近0或1

如果有其他看法欢迎留言！！！

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
bpNet		bpNet
README.en.md		README.en.md
README.md		README.md

yzx-66/bpNet

Folders and files

Latest commit

History

Repository files navigation

C++Bp神经网络

介绍

描述部分

什么是BP神经网络

执行流程

正向：

反向：

算法原理

误差

bp神经网络是如何减小误差的

一.修改加权

1.如何修改隐藏层加权

修改的表达式

链式原则

分别计算每个偏导

2.如何修改输入层加权

修改的表达式

链式原则

二.修改偏移

代码实现

一.神经网络图

二.怎莫计算误差

三.怎莫计算改变量

四.有了变化量到底怎样更新该值

五.写代码前注意事项

总结：

About

Topics

Resources

Stars

Watchers

Forks

Languages