西西河

主题:【原创】抛砖!模式识别和机器学习、数据挖掘的区别与联系 -- 永远的幻想

共:💬65 🌺337
全看分页树展 · 主题 跟帖
家园 在你面前不敢充内行

永远兄功底深厚,而且谦虚谨慎,娓娓道来,兄弟受益匪浅。

我做过视觉方向,现在在做其他方向。Viola Jones的经典方法和特征当然已经被改过很多了。但是我看到的觉得比较有效的方法好像都是循着他的思路来的。他的方法可以说是开了一个先河。最近一年忙没有去仔细了解这个方向,不知道有没有像他那样新开一个思路的文章?

虹膜和指纹的性能好还是不好,看你如何定义了。在大数据库上(比如FBI那样的数据库),哪个方法的精度都不够。不仅各个生物特征要被融合,甚至不同Vendor的产品都要被集成商融合,否则达不到精度要求。

匹配的问题其实是IR里的Ranking问题。比如指纹,如果按照多类问题的思路,在工业数据库上是百万类的级别。我做这个方向的时候,深感学术界没有能够很好的处理这个问题。一个主要问题是ML学术界很少有工业级的数据库。但是这个问题这两年已经开始引起注意,因为学术界开始面对的数据量和类别也开始向海量发展:匹配现在被归纳为一个Ranking问题,我觉得是合适的。我记得有过关于Ranking的workshop。其实就是一个如何优化ROC的问题。在大数据库上提高还是比较困难的。

静候永远兄好文。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河