主题:【原创】看了《焦点访谈》,看到了利益二字 -- 鹦鹉
以前看过的一篇引用了很多法律条款,但找不到了。临时找了一篇供参考,有兴趣的根据里面的提示google吧。
首先你没有回答我的问题,既然你花费了时间跟我辩论,也请再花多些时间简单回答一下吧。
其次,我搜索了很长时间,还是没有找到识别一个苹果和一筐苹果有什么区别。麻烦你用专业术语简单描述一下区别到底在哪里,我好自学。只是——识别色情图像与识别一个苹果与一筐苹果的区别有联系吗?
不过关于苹果,倒是有个意外的收获。一篇文章提到:
正如我前面所说,如果在一棵树上检测出80%的果实是苹果(识别率的限制),程序当然应该判定这是颗苹果树而不是梨树。同理,如果来源于某个SP的数据流里80%图片都被判定为色情图片,这个网站是色情网站的可能性是很大的吧?
另外,顺便提一下,对于某个电信的数据中心而言,其接入的SP的数目和带宽都是有限的,有针对性地分析这些数据流也并非不可完成的任务。
一个苹果意味着有监督,苹果梨子表示二类错误的引入,一筐苹果表示无监督,水果表示抽象元素的分类。这是模式这门课最基本的概念,而相对于现实中所用的模式识别技术,不过是万里长征的第一步。
即便这样,我依然相信,你一会还会有更多的问题提出,对于一个无法下意识的区分一、二类错误的学习者来说,更加优先的选择应该是重修概率论,否则你根本无法理解对海量数据识别以及其后运用贝叶斯决策的时候的风险,也根本无法对基本的统计识别模式做任何有意义的学习。至少,你可以把你所列举的80%是个什么概念的数据理解的稍微正确点。
进一步的选择应该是控制原理,否则你将不知道怎样的实现可控和可观,也不会知道在怎样的条件下无法实现,当你不知道这些的时候,你将会提出很多似乎极其正确的要求;所以你必须知道的是,即使是细微的极点和零点的变动,也将可能对你的识别系统产生根本性的变化,否则,你会提出“一个苹果和一筐苹果有什么不同”的问题。按照智能技术的发展水平,复杂元素的识别目前是不可控的,必须要精度更高的反馈器补偿 —— 也就是人脑来实现系统的可控。
接下来,我想,应该是人工智能,通过这里你可以理解贝叶斯决策理论,可以理解BP网络到VC网络的发展,进而可以知道向量的关联是如何实现的,大特征分类是基于什么,可以知道“一个苹果如何用谓语描述”;同时,你也可以了解到,人工智能技术能够到达一个怎样地步,这样至少不会举出类似“全球语音监听识别系统”这样华丽丽的传说做论据。
然后,系统辨识是需要的。否则,在面对一系列的诸如“水果”“非法图片”的抽象名词时,你会产生“建一个是建,建一双也是建”的疑惑,建一个和建N个的方法是不同的,而建有限个和建无穷个方法也是有差异的,更重要的是,对于具体对象和抽象对象的方法是不同,也就是“苹果”和“水果”的区别。而对于最后者,在巨大基数上,决策错误的概率将大的惊人,也就意味着你根本不可能信任这样一套识别决策系统,那么,你又何必去建立这套系统呢?
非线性的一些基本知识是必须的,不仅因为其中夹杂了最优决策的相关内容,更重要的是,在现实而不是matlab上,你不会找到纯线性的东西,如果不了解非线性的分类器的各种算法,那么你不能明白为什么把精确度从90%提高到95%竟然比从0提高到90%要困难若干倍,从而多少对所需的资源有个初步了解。
此外,以上都是建立在你已经牢固掌握了线性代数的基础之上的,否则,你会发现以上所有的学科都是天书。在完成这些知识结构的储备之后,你可以开始对最开始的问题进行思考。在与我学生时代的学习笔记进行比较之后,我有理由相信,你在百度上是不容易找到捷径的。
不是什么高科技,最终判断都是靠人。
如果在西西河社会现象版,有人发了个色情贴,社会版的斑竹要不要删贴?
天涯 凯蒂之类的又得多少
(不过 七五事件期间及其以后人家确实做到了不和谐的帖子虽晚必诛 虽多必诛 其先进经验值得西西河学习)
从百度到google,再到视频网站,到手机网站等等,可以说是指哪打哪,站在“道德高地”上四面出击。
太多专业术语了。尽管看的时候仍然疑问多多,但先花起来慢慢研究。大概得消化一段时间再提问了。
顺手摘一个今天刚刚看到的消息:
这就说明以印度的水平,建立一个全国范围的语音及Internet拦截筛选系统在技术上没有问题了。我确实不清楚图像识别发展的现状,不过根据指纹识别系统的成熟,与人脸识别系统的开始应用,应该不比语音识别差很多吧~~~
无论wap还是net,移动运营商的接入都有严格限制。
而且由于基站带宽有限,所以即使3g,其实际接入带宽也远远比有线dsl要小多了。要做这些过滤,参考gfw的能力的话,其实技术上并没有太大的门槛。
这个跟语音识别有什么关系?我没看出来。你自己试试最简单的例子,对着手机的语音拨号用不同的语调说几次,看看效果就行了。
至于指纹识别、人脸识别啥的,这些都是有监督识别,跟无监督的识别是两码事。。。两个完全不同的技术方向。
让计算机把苹果挑出来试试?
顺便请教一下,目前对于色情图片的识别率可以达到多高?
其算法复杂度是什么样的?平均需要的指令条数大概是多少。
对于文字处理,基于全文的关键查找是最初级的一种了。而且很容易搞出笑话来。
比如拿“果真”做关键字。
今天苹果真难吃
就会被莫名其妙的滤掉。
跟进一步的词汇划分,语法识别语义识别就属于高磕技的东西了。
离智能分析还早得很呢。