周志华《机器学习》版本空间

geekgao • 2018年1月31日下午6:23 • 机器学习 • 阅读 4302

第一章1.3节提出了一个概念“版本空间”，搞明白之后其实是蛮简单的一个东西，按书上说的西瓜问题的假设空间如下（Ø表示不存在好瓜坏瓜之分）：

编号	色泽	根蒂	敲声
1	*	*	*
2	青绿	*	*
3	乌黑	*	*
4	*	蜷缩	*
5	*	硬挺	*
6	*	稍蜷	*
7	*	*	浊响
8	*	*	清脆
9	*	*	沉闷
10	青绿	蜷缩	*
11	青绿	硬挺	*
12	青绿	稍蜷	*
13	乌黑	蜷缩	*
14	乌黑	硬挺	*
15	乌黑	稍蜷	*
16	青绿	*	浊响
17	青绿	*	清脆
18	青绿	*	沉闷
19	乌黑	*	浊响
20	乌黑	*	清脆
21	乌黑	*	沉闷
22	*	蜷缩	浊响
23	*	蜷缩	清脆
24	*	蜷缩	沉闷
25	*	硬挺	浊响
26	*	硬挺	清脆
27	*	硬挺	沉闷
28	*	稍蜷	浊响
29	*	稍蜷	清脆
30	*	稍蜷	沉闷
31	青绿	蜷缩	浊响
32	青绿	蜷缩	清脆
33	青绿	蜷缩	沉闷
34	青绿	硬挺	浊响
35	青绿	硬挺	清脆
36	青绿	硬挺	沉闷
37	青绿	稍蜷	浊响
38	青绿	稍蜷	清脆
39	青绿	稍蜷	沉闷
40	乌黑	蜷缩	浊响
41	乌黑	蜷缩	清脆
42	乌黑	蜷缩	沉闷
43	乌黑	硬挺	浊响
44	乌黑	硬挺	清脆
45	乌黑	硬挺	沉闷
46	乌黑	稍蜷	浊响
47	乌黑	稍蜷	清脆
48	乌黑	稍蜷	沉闷
49	Ø

西瓜数据集如下：

编号	色泽	根蒂	敲声	好瓜
1	青绿	蜷缩	浊响	是
2	乌黑	蜷缩	浊响	是
3	青绿	硬挺	清脆	否
4	乌黑	稍蜷	沉闷	否

书上说：

搜索过程可以不断删除与正例不一致的假设、和（或）与反例一致的假设。最终将会获得与训练集一致（即对所有训练样本能够进行正确性判断）的假设，这就是我们学得的结果。

假设1与数据1,2一致，但是也与数据3,4一致，删除

假设2与数据1一致，但是也与数据3一致，删除

假设3与数据2一致，但是也与数据4一致，删除

假设4与仅数据1,2一致，不删

假设10虽然与数据1一致，但是与数据2不一致，删除

最终得到的西瓜问题的版本空间是：

编号	色泽	根蒂	敲声
4	*	蜷缩	*
7	*	*	浊响
22	*	蜷缩	浊响

版本空间内每一个假设都可以判断上面数据集中的每一条数据，是好瓜还是不是好瓜，但是用不同的假设判断一条新数据可能会得出不一样的结果，这属于“归纳偏好”问题。

原创文章，作者：geekgao，如若转载，请注明出处：https://www.geekgao.cn/archives/103

赞 (8)

支付宝

Spark的Job、Stage、Task是按何种规则产生的

Spark的Job、Stage、Task是按何种规则产生的

上一篇 2018年1月24日下午6:25

避免创建不必要的对象(Effective Java第5条)

下一篇 2018年3月11日下午6:20

发表回复

geekgao博主

一位兢兢业业的程序员。

310 文章

49 评论

1 问题

12 粉丝

车停地库挺爽的

CanL 2026年6月5日

大一新生误入

评论于留言板
geekgao 2026年4月19日

加油

评论于留言板
eewew 2026年4月18日

作为一个刚刚打开GitHub的菜鸟我感觉来到了新大陆，私人居然也可以有网站，我也要弄一个！！！！

评论于留言板
geekgao 2025年7月6日

https://www.geekgao.cn/feed 这个呢

评论于留言板
linux 2025年7月2日

学长，站点把rss加上呗

评论于留言板
111 2025年5月12日

感同身受，兄弟

评论于谈谈工作
可燃冰 2025年5月6日

也是西安人啊，挺好的，最近就业压力还挺大的，希望明年毕业可以西安了，爱的人也在西安。

评论于留言板
qingchen 2025年4月10日

博主能写一篇最新的nas文章不，最近准备diy一个玩一玩

评论于留言板
dd 2025年1月31日

alert(“测试嘻嘻嘻一踩踩踩下”)

评论于留言板
11 2025年1月3日

博主真牛逼,刚毕业啥也干不了

评论于留言板

GitHub

返回顶部