【第5章神经网络】待推导或待解析公式征集+答疑专区 #64

Sm1les · 2019-07-25T02:33:20Z

在这里，你可以：
1.评论留下西瓜书第5章你觉得需要补充推导细节或者解析的公式编号，我们看到后会尽快进行补充；
2.评论留下你对南瓜书第5章里相关内容的疑问，我们看到后会尽快进行答疑。

TonyHzr · 2019-10-06T08:27:23Z

第五章，公式5.17
引入连接权与阈值平方和后，误差目标函数变为

想请教一下，ωi，是代表了每一层（输入层到隐含层、隐含层到输出层）的阈值和连接权吗？

十分感谢。

Sm1les · 2019-10-06T08:33:38Z

@TonyHzr 是的，正则化项通常都是针对模型的所有参数的，在神经网络模型里面所有的参数就是连接权和阈值。

TonyHzr · 2019-10-06T08:50:19Z

@TonyHzr 是的，正则化项通常都是针对模型的所有参数的，在神经网络模型里面所有的参数就是连接权和阈值。

了解了，十分感谢~

chenshijin1 · 2020-03-28T04:25:40Z

https://datawhalechina.github.io/pumpkin-book/#/chapter5/chapter5
这个在线阅读网页显示出了问题，5.10公式。

datawhalechina项目希望能够留下邮箱联系方式哦。这样反馈比较及时。
因为没有看到错误反馈专区，所以就在这儿写了，不好意思。

Sm1les · 2020-03-29T12:12:46Z

@chenshijin1 同学你好，感谢你的反馈，5.10已经改正，你没写错，这里就是错误反馈区 :)

libo-huang · 2021-04-06T02:33:15Z

5.12中的偏导没有对对j进行累加运算，但5.13中却对j进行累加运算，能不能适当解释一下，非常感谢。

Sm1les · 2021-04-06T03:27:27Z

@HLBayes 同学你好，5.12里面是对某个具体的theta_j求导，所以和其他j的取值无关，因此无需求和，例如，对theta_1求导时，跟theta_2、theta_3、theta_4等都没关系，所以只需要对theta_1求导即可。5.13里面是对某个具体的v_ih求导，由于任意一个v_ih的变动都会影响到y_1至y_l的结果，因此对v_ih求导时，需要分别将y_1至y_l对v_ih的求导结果加起来。

libo-huang · 2021-04-06T03:54:23Z

@Sm1les 感谢。明白了。v_{ih}是隐层神经元h输入的组成部分，最终构成隐层神经元h的输出b_h，并与所有“隐层-输出层”间权重w_{hj}和输出层所有神经元的阈值theta_j构成了y_j, j=1,...,l。

ZuoGangwei · 2021-07-27T07:12:20Z

南瓜书对于5.24公式的解释太长了，看不太懂，能不能出期视频讲解一下，谢谢！

Sm1les · 2021-07-28T16:29:44Z

@ZuoGangwei 好的，后续安排，到时候在南瓜书读者交流群通知，进群方式参见README最下方

wanyixue · 2023-03-18T14:32:13Z

第五章式(5.2) 中最后推导梯度的时候，\hat(yi)也应该是关于w的函数，没有对其求导，直接当成常数处理了，这似乎是不正确的。
\hat(yi)应该是阶越函数的输出，而阶越函数不可导，也没有subgradient，30页直接将\hat(yi)写入了求导的结果，似乎是不正确的。

Sm1les · 2023-03-18T14:44:17Z

@wanyixue 同学你好，损失函数L是关于w和theta的函数，只有w和theta是未知的变量，\hat(yi)和yi都是已知量，所以不用对他们求导，因此也不存在不可导一说

wanyixue · 2023-03-18T14:55:08Z

@wanyixue 同学你好，损失函数L是关于w和theta的函数，只有w和theta是未知的变量，\hat(yi)和yi都是已知量，所以不用对他们求导，因此也不存在不可导一说

\hat(yi)也是关于w和theta的函数，\hat(yi)＝epsilon(w^T+b)，也是预测出的吧，怎么能当已知量？

Sm1les · 2023-03-18T16:15:09Z

@wanyixue 因为最开始我们会随机初始化一个w_0和theta_0，然后会将所有样本代入模型找到分类错误的点构成误分类点集合M，接着从M中随机选一个误分类点(xi,yi)，根据w_0和theta_0计算出\hat(yi)，最后算出梯度并将w_0和theta_0按照参数更新公式更新到w_1和theta_1，所以此时\hat(yi)是已知量，这块南瓜书上没有展开写，推荐你去看李航老师的《统计学习方法》中的感知机那一节，里面有道例题，你跟着例题算一下会更容易理解。

Sm1les mentioned this issue Mar 18, 2023

第五章式(5.2) 中最后推导梯度的时候，\hat(yi)也应该是关于w的函数，没有对其求导，直接当成常数处理了，这似乎是不正确的。 #128

Closed

wanyixue mentioned this issue Mar 18, 2023

> @wanyixue 同学你好，损失函数L是关于w和theta的函数，只有w和theta是未知的变量，\hat(yi)和yi都是已知量，所以不用对他们求导，因此也不存在不可导一说 #129

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

【第5章神经网络】待推导或待解析公式征集+答疑专区 #64

【第5章神经网络】待推导或待解析公式征集+答疑专区 #64

Sm1les commented Jul 25, 2019

TonyHzr commented Oct 6, 2019 •

edited

Sm1les commented Oct 6, 2019

TonyHzr commented Oct 6, 2019

chenshijin1 commented Mar 28, 2020 •

edited

Sm1les commented Mar 29, 2020

libo-huang commented Apr 6, 2021

Sm1les commented Apr 6, 2021

libo-huang commented Apr 6, 2021

ZuoGangwei commented Jul 27, 2021

Sm1les commented Jul 28, 2021

wanyixue commented Mar 18, 2023

Sm1les commented Mar 18, 2023

wanyixue commented Mar 18, 2023

Sm1les commented Mar 18, 2023

【第5章神经网络】待推导或待解析公式征集+答疑专区 #64

【第5章神经网络】待推导或待解析公式征集+答疑专区 #64

Comments

Sm1les commented Jul 25, 2019

TonyHzr commented Oct 6, 2019 • edited

Sm1les commented Oct 6, 2019

TonyHzr commented Oct 6, 2019

chenshijin1 commented Mar 28, 2020 • edited

Sm1les commented Mar 29, 2020

libo-huang commented Apr 6, 2021

Sm1les commented Apr 6, 2021

libo-huang commented Apr 6, 2021

ZuoGangwei commented Jul 27, 2021

Sm1les commented Jul 28, 2021

wanyixue commented Mar 18, 2023

Sm1les commented Mar 18, 2023

wanyixue commented Mar 18, 2023

Sm1les commented Mar 18, 2023

TonyHzr commented Oct 6, 2019 •

edited

chenshijin1 commented Mar 28, 2020 •

edited