主题:【原创】机器学习的基础是什么?(0) -- 看树的老鼠
共:💬154 🌺509 🌵1
随机森林的老祖宗Leo Breiman早在2001年就总结了两者的最大区别,见论文《Statistical Modeling: The Two Cultures》,网上有。
传统的统计学基于人类主观假设出来的数据模型,为人类理解数据而总结了很多随机分布,并且过于强调这些分布的数学模型。而机器学习是为了克服这个缺点而生的,本身就只强调预测的准确性而不主张人类去理解它。
至于短期的特征在长期尺度上不管用的问题,别说机器,人类也一样,经验丰富的老年人在接受和解释新知识时比不上小学生,过去的经验会束缚创造性思考和限制新知识体系的形成。这根本就是从本质上不可克服的问题,只能在overfit和underfit中取一个折中,什么算法和技术都不可能解决问题又不付出代价,不值得花费脑力去思考。
- 相关回复 上下关系8
🙂why "脑夸克"? "夸克玻色子"带电 晓兵 字2952 2014-09-17 21:00:13
🙂"脑夸克": 阶级斗争需要巨大的计算资源 晓兵 字3570 2014-09-18 07:57:18
🙂处于原始时代、经验时代的机器学习 31 看树的老鼠 字5687 2014-07-27 10:51:01
🙂机器学习的初衷就是对统计学的反叛
🙂对统计的反叛是个大进步,但还不够 4 看树的老鼠 字1850 2014-07-29 20:08:08
🙂就是人能把想法用逻辑精确描述出来也就是近代的事情 4 三力思 字220 2014-07-30 21:59:07
🙂所以生物本能是不倾向逻辑的 川普 字249 2014-07-31 21:25:27
🙂生物喜欢相关性,或许是因为简单 1 看树的老鼠 字230 2014-07-31 22:40:44