主题:【原创】【讨论】征集图灵测试题目 -- 任爱杰
开这个帖子的起因是 121gdi 写了篇【原创】我的童年(谨以此贴证明我不是机器人)。
问题是这种文章完全不能证明121gdi 是不是 AI 机器人。现在网上大量新闻稿和其他文字都是 AI 写的。甚至可以写小说。为了比较,还特意找了个软件让 AI 根据《我在武汉的童年生活》为题写了一篇。发个机器人写的《我在武汉的童年生活》
这篇文章其实是 AI 生成的三个开头。有意思的是连在一起读并大体上不非常违和,仔细读了有些细节会显得自相矛盾。例如一个开头里说自己是四个孩子的老二,另一个开头则说自己是独生。不过,如果继续用 AI 软件的优化功能,AI 会把这些自相矛盾的地方标出,并顽固得建议改正。😅
果不其然,当把细节矛盾的三个开头的乱炖 AI 草稿放上去后,121gdi 立刻发现了问题并非常顽固得建议改正。😅 而其他 ID 则没有反应。
这其实是个“图灵测试”:
如果一个人使用测试对象皆理解的语言去询问两个他不能看见的对象任意一串问题。对象为:一个是正常思维的人、一个是机器。如果经过若干询问以后,测试者不能得出实质的区别来分辨两个受试对象的不同,则此机器通过图灵测试。
现在的测试结果显然有所不同。那么怎么分辨哪个是机器回答,哪个是人类回答呢?也有一个经典的例子:
对象一:
问:你会下象棋吗?
答:会。
问:你会下象棋吗?
答:会。
问:你会下象棋吗?
答:会。
问:你会下象棋吗?
答:会。
问:你会下象棋吗?
答:会。
对象二:
问:你会下象棋吗?
答:会。
问:你会下象棋吗?
答:不是告诉过你我会吗?
问:你会下象棋吗?
答:你烦不烦,说过多少遍了,我会!
问:你会下象棋吗?
答:QNMD。
问:你会下象棋吗?
答:(无应答,把键盘摔了)
上述测试中,哪个是人类?哪个是 AI?
当然这只是传统的图灵测试。据说 2014年已经有 AI 能够冒充一个 13 岁乌克兰男孩(多么讽刺)通过这类图灵测试。
很显然,不能因为 121gdi 有贴必回,而且回帖内容类似 AI 而认为他是 AI。🤭
所以这里开个贴征集一下图灵测试题目。不论是转载还是原创都欢迎。毕竟这些天不是俄乌战争就是上海疫情这种沉重的话题。不妨换换脑子。
问:猫坐在毯子上,因为它很温暖。什么很温暖?
问:“那颗大球击穿了桌子——因为它是泡沫塑料制成的。”什么是泡沫塑料制成的?
问:五点钟您将见到董事长。您确定要取消预约吗?
问:如果你是图灵测试者,你会问机器什么问题?
下面的问题据说是图灵自己提出的例子:
问:短诗第一行 “我把你比喻成夏天”中的“夏天”改为“春天”是不好还是更好呢?(如果是人会回答“这不押韵”。当然如果是中文就不成立了。)
问:那么 “冬天”呢,这完全符合韵律。(如果是人会回答“是的,但没人愿意被比喻成冬天。”😁)
问:你会说匹克威克先生(狄更斯小说《匹克威克外传》角色)使你想起圣诞节吗? (如果是人会回答“在某种意义上会。”假设他读过这部书。)
问:然而圣诞节是冬天的一天,我并不认为匹克威克先生会介意这个比喻。(如果是人会回答“我认为你不是认真的。冬天的一天就是典型的冬天的一天,而不是特殊的一天,如:圣诞节。”)
按照对象一的例子,前后我杠了 @月之回忆 几百个回合,他也没有生气,我有点怀疑他是AI机器人了。
然后,他又抱怨我车轱辘话反复说,这么说,他难免怀疑我是AI机器人了。
这样,我们就陷入死循环了,变成了两个AI机器人的巅峰对决?😮😮😮😮
这点小事值得生气?居然也能说成AI,吴佩孚!难道尽量全面的应答不是最基本的礼貌吗?
我的回答绝大部分都是根据你所谓的“专业”来的,毕竟你经常说自己用的是某某科学的定义,必须用科学方法,必须用专业概念来讨论问题。结果你自己连基本的理解能力都没有,你说我会生气吗?只会觉得好笑。
另一个这样说的是天空兄,但是考虑到他可能没搞清楚概念,没注意例子和声明,也未考虑到帖子真正的矛头,我还是觉得他的说法没有说服力。比如古代数学和交易成本,看上去是日常概念,但实际是两码事,也就是不知道我和你在扯些什么。还是Z兄说的实在,虽然现在已证明我那些形而上的基本正确。
好像之前我回过一个帖子,大抵是上线时间不稳定,但每次上来你都是秒回,不由得让人怀疑真的闲。但还不至于到AI的程度,你可倒好,直接揪着不放了,说别人机器人了。
最后回到问题,之前在天空兄的帖子就说过,和你讨论的五个问题,每次你都对开始的问题一再回避,然而那才是讨论的核心。甚至表现得连一点基础都没有,总是要给你贴基本常识。结果你要么不看,要么继续胡搅蛮缠,要么提出完全无关的问题。尤其是上次你认输之后,几乎全是在自问自答。
我现在怀疑,是不是没人和你说话,非得找个人扯才揪着不放。
简单讲,如果不是出于礼貌,没人有义务陪你车轱辘话,近几次甚至一再声明之后,你还在追着不放,这就很耐人寻味了。尤其是连学界定义都不承认,非得说是我发明的。
或者问铊42是什么意思?
———
图灵机的问题很简单,那就是你怎么判断你自己有智能?
而测试题目的问题更简单,可以通过证明的一定为真吗?
两者是一回事,需要一个先验或超验的标准作为认识基础,才能够理解现实,回答问题。然而这个标准往往已经以各种形式落于文字,通过数理统计(比如极大似然估计)总是能得到答案。
甚至更简单,大部分时候是AI回答,无法处理就发提醒转人工,你怎么能分辨它是不是一个人呢?类似的还有各类意见领袖,实际上是一群人写文,尽力统一文字风格,你怎么知道他是不是一个人呢?除非时间够长,你有足够认识,熟悉基本特征。
而是没有人跟我杠,抬杠这么好玩的事情,居然没有人陪我玩,你能够陪我那么久,感激不尽。
之所以你觉得是车轱辘话,那是因为科学方法只有一套,只看重逻辑与事实,我来来去去都是用这一招来跟你杠,这不是什么胡搅蛮缠,都是入门的粗浅功夫,我只不过是马步较稳而已,应对原本是非常简单,只要指出我文中的逻辑错误,或者事实不符之处就行,但我看你左支右拙,好像招架不住的样子,老是在绕,最近还多了一招,点名其他河友,这是希望他们一起上吗?
到底是谁在绕,这里有个例子,已经说得一清二楚了:我当然没有回避,恰恰是你在绕来绕去
以天空兄的帖子为例
我的回复是
你觉得AI能意识到他和讨论的冲突?能觉得我的回复是准确有效的?
交接成本意味着左手倒右手(自己跟自己)也是有成本的。进而所谓交易成本不是日常理解那种。
那种至多是市场成本,而不会考虑企业内部和政体运行。但你要直接这么说,不是打脸是什么?虽然现在也很像打脸,但这只是为了澄清,并没有这个意思。不想你整天除了形容词就是形容词。
所以我一直强调,如果要讨论这类问题,那么首先要假设对方是什么样的人,然后才能论证,你察觉不到这有多搪突?
河里现在喜欢结论,不喜欢绕来绕去的过程。但是过程你可以说看不懂、可以说别人水平不行,不理就完事了。而直接抛结论,可能就是直接冒犯(假设对方如何),甚至让你很生气了。
只是有些人材质出奇的厚,你不抛结论也没办法。
———
另外我们还可以看看你是怎么回复的
实际上所有选项都是交易费用。因为自己所花费的时间、劳动也估算在内的,要算机会成本的(甚至连占面积都算)。而不是请外人才算。要这样,左手倒右手就不叫交易费用,也就不会有交易成本低于管理成本的应该外部化之类说法。所以你连自己常用的概念都认不清楚,还能说什么?
怎么会承认有真理呢?对我来说,科学方法不过是获取知识的工具罢了,我也只是较为熟手,觉得好用而已,都说了,来来去去就那几招。
至于你说我认为别人是傻子,我自认是尊重辩论对手的,要不你贴点证据,让大伙瞅瞅,看看我是如何说别人是傻子的?
当然不是你说的左手转右手这么简单,而是一个政府部门跟另一个部门交易,或者是同一个部门里一个人跟另一个交易。这里当然存在交易费用了,最简单的,部门内部是否需要监管,要如何确定交换的比例等等,这些都是显而易见,不可能为零的交易费用
只要产品在不同人之间转了手,当然就存在交易费用,或许你是特指产品从同一个人的左手到了右手?经济学不认为这是交易啊。
之前我请你举个真实世界不存交易费用的例子,你总算在这里举出来了,可惜又是错的。
而且我也解释了,同一个人左右到右手,实际上就是交易。因为交易的定义就是技术上可以分割的边界。左手右手恰恰就是这样的。比如东西沉,费劲就是成本。我拿炒菜和运输举过例子。这里还可以改成接力棒之类的传递。不过我说再多也没用,你总是觉得你比谁都懂。不懂常识还总说自己用的是常识。
比如,上文也说了,占空间也是交易成本,你算过没有?这连左手右手都算不上。(其实把空间比作手拿东西就行了。)但实际上考虑交易成本的时候,大家多半算上。最典型的就是超市货架和加工厂库房的利用率。
客服让我输入两遍问题的就是AxI。x表示脏字,人工但不智能。
大量的电话、网络客服现在都是AxI,我的经历是从没有一次成功解决问题。当然很多次导致我过于愤怒沮丧,放弃了解决问题。后者大概就是企业用他们的价值。
应该发笑话楼。