主题:【原创】抛砖!模式识别和机器学习、数据挖掘的区别与联系 -- 永远的幻想
共:💬65 🌺337
复 我觉得……
我觉得让机器学习首先人要有点概念,否则人自己都一头雾水,想让计算机替他思考,怎么可能呢?
以前搞过神经网络和SVM,见过太多的人随便拿几个变量就去预测。
其实我在前面说为什么工科人还能混,已经说到这个了,但是没地方展开说了。
那个流程图里的“数据表示”,其实不仅仅是“量化编码”的软硬件需要背景知识,还有“特征选择”其实也是要背景知识的。
针对特定问题下得到的训练数据,构造、选取什么样的特征,直接关乎识别结果,这个比后面用什么样的ML算法还要关键。你的原始特征下是严重不可分的样本,或者是非凸的,你“没这点概念”(这个词用得太恰当了),不进行预处理,就送进一个凸优化寻优的算法,结果是可想而知的。
这就是我推荐的第一本书里提到的“没有天生优越的分类器”定理。没有一个万能方法能通吃各种数据。NN SVM确实分别以“误差低”和“在样本不可分情况下误差低”而著称,但是也不是万能的。
- 相关回复 上下关系8
🙂歡迎 ResHacker 字58 2010-07-22 07:36:34
🙂(五)对几本经典著作的评注1 26 永远的幻想 字4371 2010-07-20 18:50:44
🙂我觉得…… 2 郭既克 字216 2010-07-21 17:47:23
🙂说到点子上了
🙂永远兄好文 南寒 字52 2010-07-19 08:29:14
🙂(四)可解释性和数据挖掘 40 永远的幻想 字5445 2010-07-18 20:30:20
🙂唯了别识。把识别一定要说成预测,这个很别扭啊 mitwisdom 字0 2010-07-21 18:23:20
🙂一点建议 1 mitwisdom 字378 2010-07-21 10:51:02