Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

【第2章模型评估与选择】待推导或待解析公式征集+答疑专区 #61

Open
Sm1les opened this issue Jul 25, 2019 · 63 comments

Comments

@Sm1les
Copy link
Contributor

Sm1les commented Jul 25, 2019

在这里,你可以:
1.评论留下西瓜书第2章你觉得需要补充推导细节或者解析的公式编号,我们看到后会尽快进行补充;
2.评论留下你对南瓜书第2章里相关内容的疑问,我们看到后会尽快进行答疑。

@johnmaster
Copy link

可以整理一下西瓜书的课后习题嘛?

@Sm1les
Copy link
Contributor Author

Sm1les commented Aug 1, 2019

@johnmaster 这个有在我们的计划当中,后期会整理进去:)

@johnmaster
Copy link

@Sm1les 第二章公式2.27这块希望能解释一下。

@Sm1les
Copy link
Contributor Author

Sm1les commented Aug 1, 2019

@johnmaster 好的,我们尽快补充上去 :)

@Sm1les
Copy link
Contributor Author

Sm1les commented Aug 4, 2019

@johnmaster 同学你好,公式2.27的推导已经补充上去了,请查阅 :)

@johnmaster
Copy link

@Sm1les 谢谢你 ^_^

@LZL-CS
Copy link

LZL-CS commented Oct 14, 2019

请问公式2.21中的描述“任何一条线段所对应的样例的预测值一定小于其左边和下边的线段所对应的样例的预测值,其中蓝色线段所对应的a+b个样例的预测值相等”可以解释一下具体含义吗?

@Sm1les
Copy link
Contributor Author

Sm1les commented Oct 15, 2019

@William-LZL 这个你看一下西瓜书34页图2.4下面的那一段话应该就能懂了

@LZL-CS
Copy link

LZL-CS commented Oct 16, 2019

@William-LZL 这个你看一下西瓜书34页图2.4下面的那一段话应该就能懂了

好的,谢谢

@FuGang-cmd
Copy link

@William-LZL 这个你看一下西瓜书34页图2.4下面的那一段话应该就能懂了
能解释下吗 还是不大明白

@FuGang-cmd
Copy link

@William-LZL 这个你看一下西瓜书34页图2.4下面的那一段话应该就能懂了
能解释下吗 还是不大明白

为什么小呢

@Sm1les
Copy link
Contributor Author

Sm1les commented Oct 20, 2019

@FuGang-cmd 那你看看这篇文章里面讲的ROC曲线画法能否看懂:https://www.cnblogs.com/dlml/p/4403482.html

@LZL-CS
Copy link

LZL-CS commented Oct 21, 2019

您好,请问公式2.41中,为什么考虑到噪声不依赖于f后,中间的公式就直接为0了??

@Sm1les
Copy link
Contributor Author

Sm1les commented Oct 22, 2019

@William-LZL 同学你好,2.41那个公式的推导中间有很多小细节,我后续抽空会给补充上来,你暂时先往后面 :)

@LZL-CS
Copy link

LZL-CS commented Oct 22, 2019 via email

@msterdb
Copy link

msterdb commented Nov 12, 2019

2.41最后2步,为什么E[(f拔-y)^2] 变成了 (f拔-y)^2

@Sm1les
Copy link
Contributor Author

Sm1les commented Nov 12, 2019

@William-LZL @msterdb 同学你好,公式2.41的推导我已经补充上去了,请查阅 :)

@yuruotong1
Copy link

请问,第二章,书中p29页的2.2公式,为什么没有Pi,即选中Xi的机率

@Sm1les
Copy link
Contributor Author

Sm1les commented Nov 13, 2019

@yuruotong1 同学你好,公式2.2算的是均方误差,不是在算期望值,所以也就不需要考虑选中x_i的概率。

@yuruotong1
Copy link

@Sm1les 我懂了,回答的真及时,赞

@yuruotong1
Copy link

请问,第二章,书中p32页的2.11公式,加权调和平均是怎么来的,为什么会有两个beta,按我自己理解,有一个beta足够表明查准率和查全率的偏好,还有,为什么是平方?

@Sm1les
Copy link
Contributor Author

Sm1les commented Nov 15, 2019

@yuruotong1 同学你好,你这就刁难到我胖虎了,我觉得这个就当定义来理解就好了 :)

@hehuakun
Copy link

请问一下,能解释一下PR曲线是如何绘制出来的吗?

@Sm1les
Copy link
Contributor Author

Sm1les commented Nov 26, 2019

@hehuakun 这是我前面给另一位同学发的ROC曲线画法:https://www.cnblogs.com/dlml/p/4403482.html,PR曲线思路一致。

@gitwbc
Copy link

gitwbc commented Dec 18, 2019

请问公式2.21中的描述“任何一条线段所对应的样例的预测值一定小于其左边和下边的线段所对应的样例的预测值,其中蓝色线段所对应的a+b个样例的预测值相等”可以解释一下具体含义吗?

有同样的疑问,能解答一下吗?

@gitwbc
Copy link

gitwbc commented Dec 18, 2019

有关公式2.21的图,图中有蓝色线段,但是按西瓜书上的说法,一条线段或者平行于横轴(假正例),或者平行于纵轴(真正例),不可能出现蓝色线段的情况。

@Sm1les
Copy link
Contributor Author

Sm1les commented Dec 19, 2019

@gitwbc 同学你好,书上确实是没说这种情况,但是实际应用场景中确实存在这种情况,而且公式2.21也是有考虑到这种情形,所以我们才对公式2.21进行了解析。

@PASSENGER128
Copy link

请问一下,能解释一下公式2.32是怎么推导出来的,不应该还有根号k吗?

@Sm1les
Copy link
Contributor Author

Sm1les commented Mar 21, 2020

@PASSENGER128 好的,这个公式我们补充完后会艾特你 :)

@PASSENGER128
Copy link

请问公式2.34是怎么推导出来的,还有它的均值和方差为什么是(k + 1) / 2与(k^2 - 1)/ 12N 呢

@XiaodanPan
Copy link

@johnmaster 同学你好,公式2.27的推导已经补充上去了,请查阅 :)

公式2.27还是有些疑惑,最后推导出来的表达式和勘误后的式子不一样啊?

@Sm1les
Copy link
Contributor Author

Sm1les commented May 23, 2020

@XiaodanPan 同学你好,能截图说明一下哪里不一样吗?

@XiaodanPan
Copy link

XiaodanPan commented May 23, 2020 via email

@Sm1les
Copy link
Contributor Author

Sm1les commented May 23, 2020

@XiaodanPan 我勘误修正后的式子也互换了呀

@XiaodanPan
Copy link

XiaodanPan commented May 23, 2020 via email

@XiaodanPan
Copy link

XiaodanPan commented May 23, 2020 via email

@wanbachenxiao1992
Copy link

能否推导一下式2.26求偏导的过程

@Sm1les
Copy link
Contributor Author

Sm1les commented Aug 5, 2020

@wanbachenxiao1992 书里有这一步吗?

@wanbachenxiao1992
Copy link

@wanbachenxiao1992 书里有这一步吗?

书里有,是为了证明符合二项分布,我已经推导了一下~感谢。

@Sm1les
Copy link
Contributor Author

Sm1les commented Aug 8, 2020

@wanbachenxiao1992 奥奥,看到了,在公式下方的小字里面,推导出来了就好~

@JIANFANGLIU
Copy link

为什么P-R曲线会有R=1,P=0或者R=0,P=1的情况出现

@Sm1les
Copy link
Contributor Author

Sm1les commented Sep 6, 2020

@JIANFANGLIU 为啥不能有这种情况出现呢?

@Harvestning
Copy link

@Sm1les 你好,我认为PumpkinBook在解释公式2.20时绘制的8个测试样本的ROC曲线的坐标轴数学符号不太准确,与书本P34最后一段的描述不相符。

@Sm1les
Copy link
Contributor Author

Sm1les commented Dec 24, 2020

@Harvestning 同学你好,之前的图确实画得确实有问题,前天我已修订了一版,你可以在repo里面的markdwon文档看到最新版 :)

@Harvestning
Copy link

@Harvestning 同学你好,之前的图确实画得确实有问题,前天我已修订了一版,你可以在repo里面的markdwon文档看到最新版 :)

我没有找到,不知道是不是打不开[捂脸]

@Sm1les
Copy link
Contributor Author

Sm1les commented Dec 27, 2020

@Harvestning 这是在线阅读的地址:https://datawhalechina.github.io/pumpkin-book/#/chapter2/chapter2 ,我刚剪裁了一下图片,你看能看到吗?

@Harvestning
Copy link

@Harvestning 这是在线阅读的地址:https://datawhalechina.github.io/pumpkin-book/#/chapter2/chapter2 ,我刚剪裁了一下图片,你看能看到吗?
我的仍然看不到,可能是浏览器的问题,不知道其他的伙伴,没有关系,暂时这样吧

@Harvestning
Copy link

@Sm1les 胖虎你好,我想问一个附录里的问题,文中这么一段话“对于此方程,通常不一定正好解得一个整数C使得方程成立,”请问下面一行的公式是什么含义啊(我自己还是了解一些假设检验的)

@Sm1les
Copy link
Contributor Author

Sm1les commented Jan 14, 2021

@Harvestning 同学你好,你看的应该是pdf版吧?我刚核对了一下, pdf里面的那个公式在第一个alpha后面少一个换行,近期我们会更新一下pdf,你可以先看实时更新的在线版本:https://datawhalechina.github.io/pumpkin-book/#/chapter2/chapter2 ,谢谢你的反馈 :)

@Harvestning
Copy link

@Harvestning 同学你好,你看的应该是pdf版吧?我刚核对了一下, pdf里面的那个公式在第一个alpha后面少一个换行,近期我们会更新一下pdf,你可以先看实时更新的在线版本:https://datawhalechina.github.io/pumpkin-book/#/chapter2/chapter2 ,谢谢你的反馈 :)

不客气,嘿嘿......

@Harvestning
Copy link

@Sm1les 您好,有个问题请求帮助。公式2.34上面(k+1)/2和(k^2-1)/12N是怎么来的呀?

@haokong2048
Copy link

ROC曲线出现蓝色线段的原因,是有一个真正例和一个假正例等于取定的阈值,是这样吗?

@Sm1les
Copy link
Contributor Author

Sm1les commented Mar 12, 2021

@haokong2048 是的

@ghost
Copy link

ghost commented Jul 10, 2021

在2.41的偏差方-方差分解的公式中,请问这里使用的期望泛化误差E(f;D)是否就等于训练误差(经验误差)的期望?因为泛化误差衡量的是模型在除开拿到的数据集之外,没见过的数据上的表现,但这里y_D只是拿到的数据集D里的标记,并不能代表全部的样本,(f(x;D)-y_D)^2是模型的训练误差。如果是的话,可不可以理解成因为现实情况中收集到全部数据样本是很罕见的,比如通过预测人的身高预测体重,不可能去收集全球几十亿人的信息,所以在计算的时候就通过在局部数据上的训练误差来近似代表在全局数据上的泛化误差?

@bluesun98
Copy link

您好,想请问一下为什么5×2折交叉验证(2.32式那里)可以缓解测试错误率的非独立性呢

@Aikoin
Copy link

Aikoin commented Sep 7, 2022

您好^^!想请教一下,书中“机器学习问题通常是NP难甚至更难,而学习算法必然是在多项式时间内运行完成,若可彻底避免过拟合,意味着证明了P=NP....”这段有些疑惑,用P时间算法解决NP难问题,为什么会说是解决了过拟合呢?为什么不是欠拟合呢?

@Aikoin
Copy link

Aikoin commented Sep 8, 2022

您好!请问图2.5代价曲线与期望总体代价,为什么说“所有线段下界围成的面积即为在所有条件下学习器的期望总体代价”呢?

@Aikoin
Copy link

Aikoin commented Sep 8, 2022

您好!请问图2.5代价曲线与期望总体代价,为什么说“所有线段下界围成的面积即为在所有条件下学习器的期望总体代价”呢?

我好像知道啦,为了怕以后有同学有同样的疑问就不删除了,自己回复一下:取下界就是取当前条件下的最优(总代价最小的分类策略),那么取所有线段下界就是对所有不同的条件都取最优,围成的面积其实就是一个所有条件下最优的期望代价,每个分段其实是对应了不同的分类策略(阈值的选择?),而不是同一个分类策略在不同正例概率(代价)下的期望。
(如果有误请大家指正!谢谢^^!)

@Aikoin
Copy link

Aikoin commented Sep 16, 2022

您好 希望能补充一下2.30 查了t分布和卡方分布还是不太懂为什么这个变量服从t分布 TT

@Aikoin
Copy link

Aikoin commented Sep 17, 2022

您好 希望能补充一下2.30 查了t分布和卡方分布还是不太懂为什么这个变量服从t分布 TT

我会啦

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests