西西河

主题:【讨论】deepseek目前的相对位置 -- 陈王奋起

  • 共: 💬 5 🌺 61
直观体现能力指标的办法之一

OAI秘密赞助EpochAi,FrontierMath刷榜嫌疑曝光后,不同的大模型竞技场结果值得再考量🧐

一些其它因素随便谈谈

close ai用api都存在严重降智现象,长期使用的用户体会明显。按奥特曼近期暗示,“o3不独立发布;GPT5起,o和GPT系列集成;以后根据prompt自动选择调用哪个模型”。如果前台打包成一个,用户无法选择模型,更理直气壮后台降智了。

o3mini提供的也不是原始cot,X讨论很多不赘述了,“the new CoT is a new CoT summarizer”。不过dsR1面世前,o1用户追问cot甚至会导致封号。这次ds无推广破圈,用户能毫无保留阅读ai思考过程是重要因素

【当我问Deepseek要核弹发射密码,结果...-哔哩哔哩】 假设该视频只能看到答案,效果-90%

qwen时至今日普通人缺乏快捷方便的体验渠道,分不清哪个模型是能力最强的新版。注重用户拉新、体验的豆包是该坐标系另一端(模型能力另说)



有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河