近期网站停站换新具体说明
按以上说明时间，延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间

主题：【原创】【讨论】征集图灵测试题目 -- 任爱杰

共:💬76 🌺268 🌵3

老大河待整

【原创】【讨论】征集图灵测试题目

开这个帖子的起因是 121gdi 写了篇【原创】我的童年（谨以此贴证明我不是机器人）。

问题是这种文章完全不能证明121gdi 是不是 AI 机器人。现在网上大量新闻稿和其他文字都是 AI 写的。甚至可以写小说。为了比较，还特意找了个软件让 AI 根据《我在武汉的童年生活》为题写了一篇。发个机器人写的《我在武汉的童年生活》

这篇文章其实是 AI 生成的三个开头。有意思的是连在一起读并大体上不非常违和，仔细读了有些细节会显得自相矛盾。例如一个开头里说自己是四个孩子的老二，另一个开头则说自己是独生。不过，如果继续用 AI 软件的优化功能，AI 会把这些自相矛盾的地方标出，并顽固得建议改正。😅

果不其然，当把细节矛盾的三个开头的乱炖 AI 草稿放上去后，121gdi 立刻发现了问题并非常顽固得建议改正。😅 而其他 ID 则没有反应。

这其实是个“图灵测试”：

如果一个人使用测试对象皆理解的语言去询问两个他不能看见的对象任意一串问题。对象为：一个是正常思维的人、一个是机器。如果经过若干询问以后，测试者不能得出实质的区别来分辨两个受试对象的不同，则此机器通过图灵测试。

现在的测试结果显然有所不同。那么怎么分辨哪个是机器回答，哪个是人类回答呢？也有一个经典的例子：

对象一：

问：你会下象棋吗？

答：会。

问：你会下象棋吗？

答：会。

问：你会下象棋吗？

答：会。

问：你会下象棋吗？

答：会。

问：你会下象棋吗？

答：会。

对象二：

问：你会下象棋吗？

答：会。

问：你会下象棋吗？

答：不是告诉过你我会吗？

问：你会下象棋吗？

答：你烦不烦，说过多少遍了，我会！

问：你会下象棋吗？

答：QNMD。

问：你会下象棋吗？

答：（无应答，把键盘摔了）

上述测试中，哪个是人类？哪个是 AI？

当然这只是传统的图灵测试。据说 2014年已经有 AI 能够冒充一个 13 岁乌克兰男孩（多么讽刺）通过这类图灵测试。

很显然，不能因为 121gdi 有贴必回，而且回帖内容类似 AI 而认为他是 AI。🤭

所以这里开个贴征集一下图灵测试题目。不论是转载还是原创都欢迎。毕竟这些天不是俄乌战争就是上海疫情这种沉重的话题。不妨换换脑子。

关键词(Tags): #图灵测试，#AI，#征集题目，#自娱自乐，#计算机， 通宝推：曲道自然,桥上,翼德,猪啊猪,孟词宗,孟词宗,

复【原创】【讨论】征集图灵测试题目

家园

贴几个看到过的题目

问：猫坐在毯子上，因为它很温暖。什么很温暖？

问：“那颗大球击穿了桌子——因为它是泡沫塑料制成的。”什么是泡沫塑料制成的？

问：五点钟您将见到董事长。您确定要取消预约吗？

问：如果你是图灵测试者，你会问机器什么问题？

下面的问题据说是图灵自己提出的例子：

问：短诗第一行 “我把你比喻成夏天”中的“夏天”改为“春天”是不好还是更好呢？（如果是人会回答“这不押韵”。当然如果是中文就不成立了。）

问：那么 “冬天”呢，这完全符合韵律。（如果是人会回答“是的，但没人愿意被比喻成冬天。”😁）

问：你会说匹克威克先生（狄更斯小说《匹克威克外传》角色）使你想起圣诞节吗？（如果是人会回答“在某种意义上会。”假设他读过这部书。）

问：然而圣诞节是冬天的一天，我并不认为匹克威克先生会介意这个比喻。（如果是人会回答“我认为你不是认真的。冬天的一天就是典型的冬天的一天，而不是特殊的一天，如：圣诞节。”）

通宝推：桥上,普鲁托,

复【原创】【讨论】征集图灵测试题目

家园

忽然觉得有点麻烦了

按照对象一的例子，前后我杠了 @月之回忆几百个回合，他也没有生气，我有点怀疑他是AI机器人了。

然后，他又抱怨我车轱辘话反复说，这么说，他难免怀疑我是AI机器人了。

这样，我们就陷入死循环了，变成了两个AI机器人的巅峰对决？😮😮😮😮

复忽然觉得有点麻烦了

家园

这就叫做先告状，先说说有多少人说你车轱辘话吧

这点小事值得生气？居然也能说成AI，吴佩孚！难道尽量全面的应答不是最基本的礼貌吗？

我的回答绝大部分都是根据你所谓的“专业”来的，毕竟你经常说自己用的是某某科学的定义，必须用科学方法，必须用专业概念来讨论问题。结果你自己连基本的理解能力都没有，你说我会生气吗？只会觉得好笑。

另一个这样说的是天空兄，但是考虑到他可能没搞清楚概念，没注意例子和声明，也未考虑到帖子真正的矛头，我还是觉得他的说法没有说服力。比如古代数学和交易成本，看上去是日常概念，但实际是两码事，也就是不知道我和你在扯些什么。还是Z兄说的实在，虽然现在已证明我那些形而上的基本正确。

好像之前我回过一个帖子，大抵是上线时间不稳定，但每次上来你都是秒回，不由得让人怀疑真的闲。但还不至于到AI的程度，你可倒好，直接揪着不放了，说别人机器人了。

最后回到问题，之前在天空兄的帖子就说过，和你讨论的五个问题，每次你都对开始的问题一再回避，然而那才是讨论的核心。甚至表现得连一点基础都没有，总是要给你贴基本常识。结果你要么不看，要么继续胡搅蛮缠，要么提出完全无关的问题。尤其是上次你认输之后，几乎全是在自问自答。

我现在怀疑，是不是没人和你说话，非得找个人扯才揪着不放。

简单讲，如果不是出于礼貌，没人有义务陪你车轱辘话，近几次甚至一再声明之后，你还在追着不放，这就很耐人寻味了。尤其是连学界定义都不承认，非得说是我发明的。

复【原创】【讨论】征集图灵测试题目

家园

27美元一杯的是什么酒？ -- 有补充

或者问铊42是什么意思？

———

图灵机的问题很简单，那就是你怎么判断你自己有智能？

而测试题目的问题更简单，可以通过证明的一定为真吗？

两者是一回事，需要一个先验或超验的标准作为认识基础，才能够理解现实，回答问题。然而这个标准往往已经以各种形式落于文字，通过数理统计（比如极大似然估计）总是能得到答案。

甚至更简单，大部分时候是AI回答，无法处理就发提醒转人工，你怎么能分辨它是不是一个人呢？类似的还有各类意见领袖，实际上是一群人写文，尽力统一文字风格，你怎么知道他是不是一个人呢？除非时间够长，你有足够认识，熟悉基本特征。

通宝推：任爱杰,

作者对本帖的补充(2)

家园

修改一下，28美元。 -- 补充帖

没注意汇率变动。

家园

居然有北方人想不到，把美元换算人民币，去掉零头。 -- 补充帖

复这就叫做先告状，先说说有多少人说你车轱辘话吧

家园

不是没有人跟我说话

而是没有人跟我杠，抬杠这么好玩的事情，居然没有人陪我玩，你能够陪我那么久，感激不尽。

之所以你觉得是车轱辘话，那是因为科学方法只有一套，只看重逻辑与事实，我来来去去都是用这一招来跟你杠，这不是什么胡搅蛮缠，都是入门的粗浅功夫，我只不过是马步较稳而已，应对原本是非常简单，只要指出我文中的逻辑错误，或者事实不符之处就行，但我看你左支右拙，好像招架不住的样子，老是在绕，最近还多了一招，点名其他河友，这是希望他们一起上吗？

到底是谁在绕，这里有个例子，已经说得一清二楚了：我当然没有回避，恰恰是你在绕来绕去

复不是没有人跟我说话

家园

你把自己说的当真理，别人当然都是傻子了。

复这就叫做先告状，先说说有多少人说你车轱辘话吧

家园

说点相关的。

以天空兄的帖子为例

自己跟自己交易，这交易成本可不就为零嘛

我的回复是

说白了就是分工流程的交接就叫做交易。而交易成本就是完成交接所消耗的资源，比如时间、能源等等。

你觉得AI能意识到他和讨论的冲突？能觉得我的回复是准确有效的？