西西河

主题:【原创】看了《焦点访谈》,看到了利益二字 -- 鹦鹉

共:💬90 🌺66
全看分页树展 · 主题 跟帖
家园 首先。。。啥是色情图片?

这么举例子吧,人脸识别,这个知道吧。

一个小学生帮老奶奶做好事,那么老奶奶会记得他的脸。。。如果一群小学生帮老奶奶做好事呢,那么老奶奶记不住啊,这时候,你可以说,找一个记忆力好的好的人来就行了。嗯,那如果是一个小学校的小学生都来做好事呢,谁也记不住啊,那么怎么办呢?那么大家就只能记住他们的校服,知道这是哪个学校的。

嗯,说到“学校”,在这里就是个抽象出来的名词,跟你所说的色情图片一样,就是某一个类别的名称;而“校服”,就是这个类别的共性特征。但如果我们把范围扩大到两个学校呢?那么这个校服的特征就不是相同的了,我们就必须把这个特征再进行模糊处理。

最后,当面临的处理样本巨大的时候,所需要的模糊量也将巨大,那么出现的后果是什么呢?一群小学生中坏孩子是不多的,但两个学校的小学生中坏孩子是有一定数量的。。。而我们前面的类别分类表明,这两个学校的孩子都是好学生,也就是说,本来这些坏孩子被我们识别为好孩子了,这就是二类错误。这个错误将随着元素的增多所导致的模糊量的增大而迅速增大。

这样,我们面对抽象名词的时候,需要明确,这个词汇到底是想描述什么,它描述的范围有多大,它需要处理的对象有多少,他要求达到多高的准确度?对象有限的时候,可以一个个去匹配(如指纹识别、人脸识别);而对于无限的对象的时候,只能抽象出共性,而这个共性的模糊量,又取决于这个名词希望涵盖的范围。以上这些,共同决定了所需的计算资源。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河