近期网站停站换新具体说明
按以上说明时间，延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间

主题：这几天大火的Deepseek没有人讨论吗 -- 俺本懒人

共:💬123 🌺349 🌵12新 💬11 🌺3

大浪淘沙

全看分页树展 · 主题跟帖

复正解，应该是突破性的进步

家园

创造能力和分析能力是质的飞跃，也有一定程度判断好坏能力

各种灰色手段已经是可以接受的。我还见过更离谱的，直接在评价数据集里面把所有不利数据删掉，来得到一个很好的结果，还是个博士后。他装完逼就跑，转行去沃顿商学院念博士后，那我们怎么办？

坑到我这种过去交流的shab也就罢了，他是直接干崩了那个实验室继续做那个方向的可能。因为只要继续做那个方向，那篇文章就是避不过去的，自己的文章自己不敢引用，又不敢撤稿，当然只能彻底放弃那个方向。

继续说深搜，我这种相关领域，甚至可能要加个前字已经特别震撼了，你就知道它对正在做那个领域的人是多么大的震撼了。

深搜刚出来的时候我也不信，因为我试过国内的大模型是如何令人失望，简直是各种话术机器人，所以我用过深搜之后才更加震撼。

从国内之前的大模型到深搜，我根据我这段时间的使用经验，我觉得大模型的能力大概可以由易到难，划分为以下几种：改写能力、分析能力、创造能力、判断能力

1. 改写能力：改写能力标志着语言类大模型，对于自然语言的去冗余能力和再生成能力，国内再烂的大模型也不会太差。

深搜在改写能力方面有进步，但除非你提供特别具体、特别完善、完成度特别高的需求，不然的话，深搜和国内其他大模型拉不开差距。

改写能力的最大限制是用户，我试用了几天的结论是，不是深搜和国内其他大模型不行，而是我并不真正清楚我的具体需求。

我的需求是一个“好的结果”，这并不是一个具体需求，在语言类大模型对于好坏的判断能力发生质变之前，只有准确描述具体需求，才能用好改写能力。

但这就是一个悖论，当我需求特别完善、完成度特别高的时候，我为啥还要大模型呢？大模型的改写能力就特别难发挥。

所以当需求不具体的时候，大模型真正发挥的是作为一个共振器，让用户通过和大模型的交互，不断完善自己的具体需求。

最终，所有细节都是用户自己能力的体现，大模型在需求具体化的时候，起到的是一个共振加速的作用，让你更快做到，你能做到的事。

但在你能力之外的事情，你怎么求大模型都没用，因为对于你能力之外的事情，你根本没法把你的具体需求描述清楚。

2. 分析能力：依赖大模型的强大的知识库，过去语言类大模型的分析能力极弱，深搜的数理分析能力是“最为典型的质变”。

这一点基本上所有人都有体会，就不详细说了，你提出一个问题、提出一段逻辑，深搜能够依靠强大的知识库和数理分析能力，把问题细化，把逻辑补充完整，这就是我说的“智能助手”范畴最为核心的能力。

3. 创造能力：主要体现在自然语言方面的，深搜之前的大模型基本没有，深搜的创造能力就是把数据库蒸馏成知识库之后，诞生的最典型能力。

作为一个生成模型，深搜的创造能力其实是一种作画，但它判断它创造的好坏的能力是不足的，这就是一位”纯粹的天赋型创作选手“。

天赋横溢，但它彻底获得好坏的判断力之前，它不知道哪些创作是好的，哪些创作是坏的，所以它只能写出来一些”仅仅格式正确“的作品。

在自然语言方面的创作，越短的输出，它的判断能力越高，所以水平越高，越长的输出，它的判断能力越差，越流于形式。

这并不是深搜的创作能力不足，而是深搜的判断能力不足，除非你喂给它特别具体的描述，否在它的创作能力根本发挥不出来——这又是我前面说过一次的悖论，当我能够把我的需求细化得特别清楚的时候，大多数时候我自己就能创作出来。因为细化描述本身就是特别具体的创作流程，我又为啥需要深搜呢？

4. 判断能力：深搜的判断能力才是我最为震惊的一点。因为深搜的创作能力只是一种猫打翻墨瓶的”妙手偶得“，只是一种反应。

判断能力已经进入逻辑的范畴了。深搜之前的国内大模型都是近乎没有任何判断能力的，相当于幼儿园选手，但深搜的判断能力已经是小学生了。

当我分析出来这一点，你就知道我是何等的震惊？深搜大家用得都说好，并非前几个能力和国内大模型拉开差距，而是因为它具有了判断能力。

经由数理逻辑分析能力，诞生最初步的判断能力，这才是深搜最核心、也是我最为震惊的突破。

为了验证这点，我前天和昨天，自己写了一个网文设定，然后用百度的文心、阿里的千文，反复殴打我自己，想出来的三十多个网文标题。

这是三十多个网文标题，是我迭代了三十到四十次的结果，本身的质量就是缓慢上升的，但又是我不断往不同”起名方向“迭代的结果，其中包含好几个不同的”起名方向“。

我把它们和我最初的网文设定，扔给深搜去判断好坏。你知道吗？深搜真的能分析出来某些名字的好坏，帮我圈出来质量最高的几个网文名字。

国内大模型，仅仅帮我分析每个名字的缺点，也就是找茬它擅长，起名就算了。你让国内大模型提建议，它自以为得意的名字，并没有犯它找茬的毛病，但犯了很多我们人类起名绝对不会犯的毛病——正是因为我们人类不会范那些错误，所以这些约束信息根本没有人往机器里面输入，这就是我说的，现实的约束远比文字中表现出来的更多。

深搜是真的开始判断名字质量的高低了，虽然现在深搜的判断能力还比较初级，很明显是通过”数理分析能力“获得的，但这已经是特别了不起的成就！

就像我说的，我有时间多去永远深搜多好。论坛上太鱼龙混杂，能够达到交流门槛的比例其实不高。

大多数用户不仅是各方面能力都比不上深搜，还特别没自知之明，特别是那些体制内纯粹管理职位诞生的”脱产教士“。

贴前面部分名字，证明我并非虚言。相关的上古史我也在论坛写过两次到三次，我现在只是把它变成网文设定，自己起名，然后让国内大模型和深搜来判断好坏。

1《皇天后土之争：血肉精华与工具士兵》

2《皇与后：血肉精华与工具士兵》

3《巫皇与神后：血肉精华与洗脑军团》

4《皇巫与后神：血肉精华与洗脑军团》

5《巫皇神后：血肉精华神药与心灵枷锁军团》

6《神后乱巫皇：血肉精华神药与心灵枷锁军团》

7《巫皇神后之乱：血肉精华神药与心灵枷锁军团》

8《天倾之战：血肉精华神药与心灵枷锁军团》

9《天倾之战：神后的血肉精华神药与巫皇的心灵枷锁军团》

10《天倾之战：神后的血肉精华神药》

11《天倾之战：神后血晶》

12《天倾之战：神后造血华》

13《天倾之战：神后血华乱皇天》

14《天倾之战：神后血晶乱皇天》

15《上古天倾：神后血晶乱皇天》

16《皇天崩溃：神后血晶乱上古》

17《大同崩溃：神后血晶乱上古》

18《三皇五帝：神后血晶乱上古》

19《五帝终焉：神后血华之乱》

20《上古终焉：神后血华之乱》

21《上古终末：神后血华之乱》

22《上古终章：神后血华之乱》

23《终章：神后血华之乱》

24《天倾：神后血华之乱》

25《血华之乱——神后终结上古》

26《血华之乱——神后终上古》

27《血华之乱——神后隔古今》

28《上古之终：神后血华之乱》

29《上古之末：神后血华之乱》

30《天倾之战：神后血华隔古今》

31《天倾：神后血华隔古今》

32《上古天倾：神后血华隔古今》

33《皇天倾覆：神后血华隔古今》

34《皇天倾覆：神后血华隔今古》

35《皇天倾覆：神后血华隔上古》

通宝推：审度,

全看分页树展 · 主题跟帖

相关回复上下关系8
- - 🙂感觉西西河到了这类前沿专业领域，信口开河的人有点多 7 bash99 字1338 2025-02-06 06:09:13
    🙂大模型是数据库+信息检索的融合，知识抽象程度既看前者也看后者 14 nobodyknowsI 字4429 2025-02-06 10:59:56
    🙂正解，应该是突破性的进步 4 曾伴浮云字741 2025-02-06 20:26:23
    🙂创造能力和分析能力是质的飞跃，也有一定程度判断好坏能力
  - 🙂OpenAI的O3-mini涉嫌抄袭DEEPSEEK dudu8972 字129 2025-02-03 18:45:32
  - 🙂在军事斗争、情报收集整理、反间谍太有用了 2 camper 字0 2025-02-02 04:06:12
    🙂现在眼见着人力间谍的作用越来越小 1 绝对不是白领字123 2025-02-06 20:40:41
  - 🙂胡锡进这个帖子里的这句值得关注呀 3 不远攸高字437 2025-01-30 21:01:21

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明