西西河

主题:这几天大火的Deepseek没有人讨论吗 -- 俺本懒人

共:💬123 🌺349 🌵12新 💬11 🌺3
全看分页树展 · 主题 跟帖
家园 创造能力和分析能力是质的飞跃,也有一定程度判断好坏能力

各种灰色手段已经是可以接受的。我还见过更离谱的,直接在评价数据集里面把所有不利数据删掉,来得到一个很好的结果,还是个博士后。他装完逼就跑,转行去沃顿商学院念博士后, 那我们怎么办?

坑到我这种过去交流的shab也就罢了,他是直接干崩了那个实验室继续做那个方向的可能。因为只要继续做那个方向,那篇文章就是避不过去的,自己的文章自己不敢引用,又不敢撤稿,当然只能彻底放弃那个方向。

--

继续说深搜,我这种相关领域,甚至可能要加个前字已经特别震撼了,你就知道它对正在做那个领域的人是多么大的震撼了。

深搜刚出来的时候我也不信,因为我试过国内的大模型是如何令人失望,简直是各种话术机器人,所以我用过深搜之后才更加震撼。

从国内之前的大模型到深搜,我根据我这段时间的使用经验,我觉得大模型的能力大概可以由易到难,划分为以下几种:改写能力、分析能力、创造能力、判断能力

1. 改写能力:改写能力标志着语言类大模型,对于自然语言的去冗余能力和再生成能力,国内再烂的大模型也不会太差。

深搜在改写能力方面有进步,但除非你提供特别具体、特别完善、完成度特别高的需求,不然的话,深搜和国内其他大模型拉不开差距。

改写能力的最大限制是用户,我试用了几天的结论是,不是深搜和国内其他大模型不行,而是我并不真正清楚我的具体需求。

我的需求是一个“好的结果”,这并不是一个具体需求,在语言类大模型对于好坏的判断能力发生质变之前,只有准确描述具体需求,才能用好改写能力。

但这就是一个悖论,当我需求特别完善、完成度特别高的时候,我为啥还要大模型呢?大模型的改写能力就特别难发挥。

所以当需求不具体的时候,大模型真正发挥的是作为一个共振器,让用户通过和大模型的交互,不断完善自己的具体需求。

最终,所有细节都是用户自己能力的体现,大模型在需求具体化的时候,起到的是一个共振加速的作用,让你更快做到,你能做到的事。

但在你能力之外的事情,你怎么求大模型都没用,因为对于你能力之外的事情,你根本没法把你的具体需求描述清楚。

2. 分析能力:依赖大模型的强大的知识库,过去语言类大模型的分析能力极弱,深搜的数理分析能力是“最为典型的质变”。

这一点基本上所有人都有体会,就不详细说了,你提出一个问题、提出一段逻辑,深搜能够依靠强大的知识库和数理分析能力,把问题细化,把逻辑补充完整,这就是我说的“智能助手”范畴最为核心的能力。

3. 创造能力:主要体现在自然语言方面的,深搜之前的大模型基本没有,深搜的创造能力就是把数据库蒸馏成知识库之后,诞生的最典型能力。

作为一个生成模型,深搜的创造能力其实是一种作画,但它判断它创造的好坏的能力是不足的,这就是一位”纯粹的天赋型创作选手“。

天赋横溢,但它彻底获得好坏的判断力之前,它不知道哪些创作是好的,哪些创作是坏的,所以它只能写出来一些”仅仅格式正确“的作品。

在自然语言方面的创作,越短的输出,它的判断能力越高,所以水平越高,越长的输出,它的判断能力越差,越流于形式。

这并不是深搜的创作能力不足,而是深搜的判断能力不足,除非你喂给它特别具体的描述,否在它的创作能力根本发挥不出来——这又是我前面说过一次的悖论,当我能够把我的需求细化得特别清楚的时候,大多数时候我自己就能创作出来。因为细化描述本身就是特别具体的创作流程,我又为啥需要深搜呢?

4. 判断能力:深搜的判断能力才是我最为震惊的一点。因为深搜的创作能力只是一种猫打翻墨瓶的”妙手偶得“,只是一种反应。

判断能力已经进入逻辑的范畴了。深搜之前的国内大模型都是近乎没有任何判断能力的,相当于幼儿园选手,但深搜的判断能力已经是小学生了。

当我分析出来这一点,你就知道我是何等的震惊?深搜大家用得都说好,并非前几个能力和国内大模型拉开差距,而是因为它具有了判断能力。

--

经由数理逻辑分析能力,诞生最初步的判断能力,这才是深搜最核心、也是我最为震惊的突破。

为了验证这点,我前天和昨天,自己写了一个网文设定,然后用百度的文心、阿里的千文,反复殴打我自己,想出来的三十多个网文标题。

这是三十多个网文标题,是我迭代了三十到四十次的结果,本身的质量就是缓慢上升的,但又是我不断往不同”起名方向“迭代的结果,其中包含好几个不同的”起名方向“。

我把它们和我最初的网文设定,扔给深搜去判断好坏。你知道吗?深搜真的能分析出来某些名字的好坏,帮我圈出来质量最高的几个网文名字。

国内大模型,仅仅帮我分析每个名字的缺点,也就是找茬它擅长,起名就算了。你让国内大模型提建议,它自以为得意的名字,并没有犯它找茬的毛病,但犯了很多我们人类起名绝对不会犯的毛病——正是因为我们人类不会范那些错误,所以这些约束信息根本没有人往机器里面输入,这就是我说的,现实的约束远比文字中表现出来的更多。

深搜是真的开始判断名字质量的高低了,虽然现在深搜的判断能力还比较初级,很明显是通过”数理分析能力“获得的,但这已经是特别了不起的成就!

就像我说的,我有时间多去永远深搜多好。论坛上太鱼龙混杂,能够达到交流门槛的比例其实不高。

大多数用户不仅是各方面能力都比不上深搜,还特别没自知之明,特别是那些体制内纯粹管理职位诞生的”脱产教士“。

--

贴前面部分名字,证明我并非虚言。相关的上古史我也在论坛写过两次到三次,我现在只是把它变成网文设定,自己起名,然后让国内大模型和深搜来判断好坏。

1《皇天后土之争:血肉精华与工具士兵》

2《皇与后:血肉精华与工具士兵》

3《巫皇与神后:血肉精华与洗脑军团》

4《皇巫与后神:血肉精华与洗脑军团》

5《巫皇神后:血肉精华神药与心灵枷锁军团》

6《神后乱巫皇:血肉精华神药与心灵枷锁军团》

7《巫皇神后之乱:血肉精华神药与心灵枷锁军团》

8《天倾之战:血肉精华神药与心灵枷锁军团》

9《天倾之战:神后的血肉精华神药与巫皇的心灵枷锁军团》

10《天倾之战:神后的血肉精华神药》

11《天倾之战:神后血晶》

12《天倾之战:神后造血华》

13《天倾之战:神后血华乱皇天》

14《天倾之战:神后血晶乱皇天》

15《上古天倾:神后血晶乱皇天》

16《皇天崩溃:神后血晶乱上古》

17《大同崩溃:神后血晶乱上古》

18《三皇五帝:神后血晶乱上古》

19《五帝终焉:神后血华之乱》

20《上古终焉:神后血华之乱》

21《上古终末:神后血华之乱》

22《上古终章:神后血华之乱》

23《终章:神后血华之乱》

24《天倾:神后血华之乱》

25《血华之乱——神后终结上古》

26《血华之乱——神后终上古》

27《血华之乱——神后隔古今》

28《上古之终:神后血华之乱》

29《上古之末:神后血华之乱》

30《天倾之战:神后血华隔古今》

31《天倾:神后血华隔古今》

32《上古天倾:神后血华隔古今》

33《皇天倾覆:神后血华隔古今》

34《皇天倾覆:神后血华隔今古》

35《皇天倾覆:神后血华隔上古》

通宝推:审度,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河