主题：【讨论】deepseek目前的相对位置 -- 陈王奋起

直观体现能力指标的办法之一

OAI秘密赞助EpochAi，FrontierMath刷榜嫌疑曝光后，不同的大模型竞技场结果值得再考量🧐

一些其它因素随便谈谈

close ai用api都存在严重降智现象，长期使用的用户体会明显。按奥特曼近期暗示，“o3不独立发布；GPT5起，o和GPT系列集成；以后根据prompt自动选择调用哪个模型”。如果前台打包成一个，用户无法选择模型，更理直气壮后台降智了。

o3mini提供的也不是原始cot，X讨论很多不赘述了，“the new CoT is a new CoT summarizer”。不过dsR1面世前，o1用户追问cot甚至会导致封号。这次ds无推广破圈，用户能毫无保留阅读ai思考过程是重要因素

qwen时至今日普通人缺乏快捷方便的体验渠道，分不清哪个模型是能力最强的新版。注重用户拉新、体验的豆包是该坐标系另一端（模型能力另说）

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友