西西河

主题:【原创】看了《焦点访谈》,看到了利益二字 -- 鹦鹉

共:💬90 🌺66
分页树展主题 · 全看首页 上页
/ 6
下页 末页
                                          • 家园 可以识别出计算机型号的话,仍然没法识别出某个器官?

                                            只是还没有看懂你的文章,所以非常不解:从背景中识别出某个特定的计算机型号,与识别出某个特定的人体器官有什么本质区别。。。

                                            • 家园 毫无疑问,可以识别出人体器官

                                              如果你可以把所有人体器官的各种形态都像所有计算机型号一样规范化的存入数据库的话,那么毫无疑问是可以识别出来的,并且可以保证不出错。如果你可以把所有人的语音的各种音频音调数据都能准确的录入数据库的话,那么你就可以等着国家科学进步特等奖了。

                                              你的这个问题就如,既然一个家庭里面可以实现共产主义,那么一个国家为什么就不能实现共产主义呢?是啊,为什么呢?我也疑惑中。。。

                                      • 家园 嗬嗬,看到这方面专业人士说话了

                                        顺便请教一下,目前对于色情图片的识别率可以达到多高?

                                        其算法复杂度是什么样的?平均需要的指令条数大概是多少。

                                        • 家园 首先。。。啥是色情图片?

                                          这么举例子吧,人脸识别,这个知道吧。

                                          一个小学生帮老奶奶做好事,那么老奶奶会记得他的脸。。。如果一群小学生帮老奶奶做好事呢,那么老奶奶记不住啊,这时候,你可以说,找一个记忆力好的好的人来就行了。嗯,那如果是一个小学校的小学生都来做好事呢,谁也记不住啊,那么怎么办呢?那么大家就只能记住他们的校服,知道这是哪个学校的。

                                          嗯,说到“学校”,在这里就是个抽象出来的名词,跟你所说的色情图片一样,就是某一个类别的名称;而“校服”,就是这个类别的共性特征。但如果我们把范围扩大到两个学校呢?那么这个校服的特征就不是相同的了,我们就必须把这个特征再进行模糊处理。

                                          最后,当面临的处理样本巨大的时候,所需要的模糊量也将巨大,那么出现的后果是什么呢?一群小学生中坏孩子是不多的,但两个学校的小学生中坏孩子是有一定数量的。。。而我们前面的类别分类表明,这两个学校的孩子都是好学生,也就是说,本来这些坏孩子被我们识别为好孩子了,这就是二类错误。这个错误将随着元素的增多所导致的模糊量的增大而迅速增大。

                                          这样,我们面对抽象名词的时候,需要明确,这个词汇到底是想描述什么,它描述的范围有多大,它需要处理的对象有多少,他要求达到多高的准确度?对象有限的时候,可以一个个去匹配(如指纹识别、人脸识别);而对于无限的对象的时候,只能抽象出共性,而这个共性的模糊量,又取决于这个名词希望涵盖的范围。以上这些,共同决定了所需的计算资源。

                                          • 家园 咔咔,还是精确点吧

                                            男女性生殖器以及女性乳房裸露在外的图片。即通常所说的露点照。

                                            • 家园 那医学网站首先完蛋了
                                            • 家园 不是说这个概念。。。

                                              你这个不是告诉我,你得告诉计算机,你想把具备那些特征定义为色情图片啊。。。计算机不知道啥是露点照啊。。。

                                              如果假设露点的方式都是规则的话,用个类似的图片加模糊值比对;但如果图片中你有大量的不符合你的规则的图片,这个就不好说了。。。程序的大小,得看你提取了多少规则;而规则少的话,准确率就太不靠谱了。这中间的平衡,得具体做才知道啊。

                                      • 家园 先花起来慢慢看

                                        太多专业术语了。尽管看的时候仍然疑问多多,但先花起来慢慢研究。大概得消化一段时间再提问了。

                                        顺手摘一个今天刚刚看到的消息:

                                        India To Have Automatic Communications Monitoring

                                        外链出处

                                        这就说明以印度的水平,建立一个全国范围的语音及Internet拦截筛选系统在技术上没有问题了。我确实不清楚图像识别发展的现状,不过根据指纹识别系统的成熟,与人脸识别系统的开始应用,应该不比语音识别差很多吧~~~

                                        • 家园 自动通讯管理?

                                          这个跟语音识别有什么关系?我没看出来。你自己试试最简单的例子,对着手机的语音拨号用不同的语调说几次,看看效果就行了。

                                          至于指纹识别、人脸识别啥的,这些都是有监督识别,跟无监督的识别是两码事。。。两个完全不同的技术方向。

                                  • 家园 继续纠缠不宜啊

                                    运营商也并不是都没考虑这个东西,实际上有些地方的运营商是专门做了页面信息检索然后审查的。

                                    那位兄台要求的东西太梦幻了,不懂行的人你解释也很难的。

                                    • 家园 我不知道审查了没有,但可以肯定没啥用

                                      绿坝的技术其实是很前沿的,当然他们搞不出来那是另一回事情。

分页树展主题 · 全看首页 上页
/ 6
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河