New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
【第4章决策树】待推导或待解析公式征集+答疑专区 #63
Comments
请问,图4.4的决策树,根蒂-色泽那个分支,请问为何色泽浅白判定为好瓜?根蒂(稍蜷)的分支中并没有色泽浅白的样本。 |
@Oscar-YanH 同学你好,对于这种情况,图4.2下面的段话里面有交代如何处理,如果当前结点包含的样本集合为空,则标记为叶结点,且结点类别设定为其父节点(纹理=清晰,根蒂=稍蜷)所含样本最多的类别。 |
您好,第四章公式4.10在2016年第一版的机器学习的书上是p_k而不是\rho_k,新版不在手边所以无法对照,如果有误还麻烦你们订正一下 |
@NIL-zhuang 同学您好,感谢您的反馈,这里确实是我们誊抄的时候出错了,现已订正,感谢您的反馈 :) |
请问,连续值处理一节的最后一句,“需注意的是,与离散属性不同,若当前结点划分属性为连续属性,该属性还可作为其后代结点的划分属性,例如在父结点上使用了 "密度<=0.381" ,不会禁止在子结点上使用"密度<=0.294"”,怎么理解? 如果子节点还可以使用密度这个特征,那会不会产生“密度→含糖率→密度→含糖率→……”这种深度大,甚至死循环情况?如果会,一般通过什么手段来避免呢? 感谢~ |
@HJWAJ 你反过来想一下,为啥离散属性做过划分结点后就不能再用了呢?因为按照离散属性划分后,其子节点的样本在该属性上值均相等,因此没法再根据这个属性划分了,例如:按照“根蒂=蜷缩”划分以后,其子节点中的样本的“根蒂”就全都是“蜷缩”了,但是密度不一样,如果你按照"密度<=0.381" 划分,其子节点中的样本的“密度”均小于等于0.381,但是并不相等,因此“密度”这个属性还是可以接着用来区分(或者说划分)子节点中的样本。 |
请问,第四章课后习题,从哪里找到答案呢? |
在这里,你可以:
1.评论留下西瓜书第4章你觉得需要补充推导细节或者解析的公式编号,我们看到后会尽快进行补充;
2.评论留下你对南瓜书第4章里相关内容的疑问,我们看到后会尽快进行答疑。
The text was updated successfully, but these errors were encountered: