主题:茗谈(125)再说“航空军”:强-6丙 -- 本嘉明
最典型的就是万有引力定律。第一步,观测者积累出行星运行数据;第二步,多普勒从大数据里边总结出三大定律;第三步,牛顿以多普勒定律为基础总结出万有引力定律。
大数据完成的就是前两步,而且绝对不是电脑能代替人干活。因为像“所有行星的运行周期的平方与轨道半长轴的立方之比是一个常量”这种复杂点的关系很可能是现有的大数据技术处理不了的,还需要人去试错。这还是自然科学领域。社会科学里边影响因素和干扰源要比这个多的多了。即使实用了也很可能是以前忙总做的那个课题的效果:费了半天劲做出来一个实际上大家早就知道的结论。
起码就目前看,大数据的故事大都属于自卖自夸。但是,让我比较差异的是微软预测赌球准确率奇高。我觉得即便是两个球队隔几天再次相遇也未必仍然是这个结果吧?技术水平差不多的google的预测就没那么准。我觉得这说明了两个问题:第一,真正起决定性作用的未必是技术因素,很可能是选用了什么变量才是两者差距所在,而这恰恰说明了逻辑的重要性;第二,也有可能就是平均60%的准确率加一点狗屎运。文科生也只能分析到这个程度了,还是期待理工科学生深入分析一下啊。
- 相关回复 上下关系8
压缩 7 层
🙂大约4年前见到这个东西,那时它还不叫大数据 1 老惰 字1072 2014-09-20 11:58:49
🙂冷暴政 13 本嘉明 字953 2014-07-31 16:38:54
🙂本大的知识渊博我是很佩服的 郭既克 字52 2014-07-25 19:16:46
🙂这两者应该是相辅相成的关系
🙂主要是搞预测的公司太多了 bayerno 字446 2014-07-27 11:48:11
🙂我这里专指“大数据‘对人类社会的”观察“ 7 本嘉明 字430 2014-07-25 20:34:59
🙂就技术和算法本身来讲是一样的 郭既克 字328 2014-07-26 00:26:56
🙂你儿子是对的 2 witten1 字249 2014-07-25 16:24:58