主题:【原创】看了《焦点访谈》,看到了利益二字 -- 鹦鹉
共:💬90 🌺66
一个是他的识别率,一个是他的识别模式。
识别率95%可能是可以达到,现在手机都有语音拨号,你存个语音再拨一下试试;我原来做过图像的模式识别,如果有先验条件的话,可以达到90%左右,但音频似乎比图像要困难些 —— 这个是从单个技术角度;我觉得这个方面如果把音频分解的再细一些(这对处理器要求比较高),可能在不久的将来是可以预见的。
另一个是识别模式,因为现在都是定向的识别(即给你一个模板,然后通过计算机根据具体参数去模糊匹配);但实际上如果要运用到监听系统,这个是没有模板的 —— 因为你需要监听的音频在你的资料库里是不存在的,被监听对象也不会刻意的配合你,那么如果需要匹配某个音频字段的话,这个的模糊量范围将很大,而如果模糊太大的话,那么搜索的范围和搜索的错误率将成指数倍增加。。。结论就是根本无法实际使用。
- 相关回复 上下关系8
压缩 8 层
🙂GFW也就能用DPI滤滤关键字 猪头笨笨 字22 2009-11-29 22:00:26
🙂给你1个苹果和100个梨子 驿路梨花 字26 2009-11-29 21:36:53
🙂IBM ViaVoice 可爱的中国 字370 2009-11-26 21:44:28
🙂关键问题是两个呢
🙂不错 可爱的中国 字30 2009-11-26 22:04:45
🙂你好闲好有情致啊…… 贪玩的风筝 字126 2009-11-26 21:27:11
😄终于有受不了的了 老驴 字78 2009-11-26 21:37:37
🙂-- 系统屏蔽 --。