Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

【第4章决策树】待推导或待解析公式征集+答疑专区 #63

Open
Sm1les opened this issue Jul 25, 2019 · 7 comments
Open

Comments

@Sm1les
Copy link
Contributor

Sm1les commented Jul 25, 2019

在这里,你可以:
1.评论留下西瓜书第4章你觉得需要补充推导细节或者解析的公式编号,我们看到后会尽快进行补充;
2.评论留下你对南瓜书第4章里相关内容的疑问,我们看到后会尽快进行答疑。

@Oscar-YanH
Copy link

请问,图4.4的决策树,根蒂-色泽那个分支,请问为何色泽浅白判定为好瓜?根蒂(稍蜷)的分支中并没有色泽浅白的样本。

@Sm1les
Copy link
Contributor Author

Sm1les commented Oct 19, 2019

@Oscar-YanH 同学你好,对于这种情况,图4.2下面的段话里面有交代如何处理,如果当前结点包含的样本集合为空,则标记为叶结点,且结点类别设定为其父节点(纹理=清晰,根蒂=稍蜷)所含样本最多的类别。

@NIL-zhuang
Copy link

您好,第四章公式4.10在2016年第一版的机器学习的书上是p_k而不是\rho_k,新版不在手边所以无法对照,如果有误还麻烦你们订正一下

@Sm1les
Copy link
Contributor Author

Sm1les commented Mar 18, 2020

@NIL-zhuang 同学您好,感谢您的反馈,这里确实是我们誊抄的时候出错了,现已订正,感谢您的反馈 :)

@HJWAJ
Copy link

HJWAJ commented Mar 1, 2022

请问,连续值处理一节的最后一句,“需注意的是,与离散属性不同,若当前结点划分属性为连续属性,该属性还可作为其后代结点的划分属性,例如在父结点上使用了 "密度<=0.381" ,不会禁止在子结点上使用"密度<=0.294"”,怎么理解?

如果子节点还可以使用密度这个特征,那会不会产生“密度→含糖率→密度→含糖率→……”这种深度大,甚至死循环情况?如果会,一般通过什么手段来避免呢?

感谢~

@Sm1les
Copy link
Contributor Author

Sm1les commented Mar 1, 2022

@HJWAJ 你反过来想一下,为啥离散属性做过划分结点后就不能再用了呢?因为按照离散属性划分后,其子节点的样本在该属性上值均相等,因此没法再根据这个属性划分了,例如:按照“根蒂=蜷缩”划分以后,其子节点中的样本的“根蒂”就全都是“蜷缩”了,但是密度不一样,如果你按照"密度<=0.381" 划分,其子节点中的样本的“密度”均小于等于0.381,但是并不相等,因此“密度”这个属性还是可以接着用来区分(或者说划分)子节点中的样本。

@momo-9527
Copy link

请问,第四章课后习题,从哪里找到答案呢?
尤其是编程题,github有这些编程题吗?
谢谢!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants