- 近期网站停站换新具体说明
- 按以上说明时间,延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间
主题:这几天大火的Deepseek没有人讨论吗 -- 俺本懒人
各种灰色手段已经是可以接受的。我还见过更离谱的,直接在评价数据集里面把所有不利数据删掉,来得到一个很好的结果,还是个博士后。他装完逼就跑,转行去沃顿商学院念博士后, 那我们怎么办?
坑到我这种过去交流的shab也就罢了,他是直接干崩了那个实验室继续做那个方向的可能。因为只要继续做那个方向,那篇文章就是避不过去的,自己的文章自己不敢引用,又不敢撤稿,当然只能彻底放弃那个方向。
--
继续说深搜,我这种相关领域,甚至可能要加个前字已经特别震撼了,你就知道它对正在做那个领域的人是多么大的震撼了。
深搜刚出来的时候我也不信,因为我试过国内的大模型是如何令人失望,简直是各种话术机器人,所以我用过深搜之后才更加震撼。
从国内之前的大模型到深搜,我根据我这段时间的使用经验,我觉得大模型的能力大概可以由易到难,划分为以下几种:改写能力、分析能力、创造能力、判断能力
1. 改写能力:改写能力标志着语言类大模型,对于自然语言的去冗余能力和再生成能力,国内再烂的大模型也不会太差。
深搜在改写能力方面有进步,但除非你提供特别具体、特别完善、完成度特别高的需求,不然的话,深搜和国内其他大模型拉不开差距。
改写能力的最大限制是用户,我试用了几天的结论是,不是深搜和国内其他大模型不行,而是我并不真正清楚我的具体需求。
我的需求是一个“好的结果”,这并不是一个具体需求,在语言类大模型对于好坏的判断能力发生质变之前,只有准确描述具体需求,才能用好改写能力。
但这就是一个悖论,当我需求特别完善、完成度特别高的时候,我为啥还要大模型呢?大模型的改写能力就特别难发挥。
所以当需求不具体的时候,大模型真正发挥的是作为一个共振器,让用户通过和大模型的交互,不断完善自己的具体需求。
最终,所有细节都是用户自己能力的体现,大模型在需求具体化的时候,起到的是一个共振加速的作用,让你更快做到,你能做到的事。
但在你能力之外的事情,你怎么求大模型都没用,因为对于你能力之外的事情,你根本没法把你的具体需求描述清楚。
2. 分析能力:依赖大模型的强大的知识库,过去语言类大模型的分析能力极弱,深搜的数理分析能力是“最为典型的质变”。
这一点基本上所有人都有体会,就不详细说了,你提出一个问题、提出一段逻辑,深搜能够依靠强大的知识库和数理分析能力,把问题细化,把逻辑补充完整,这就是我说的“智能助手”范畴最为核心的能力。
3. 创造能力:主要体现在自然语言方面的,深搜之前的大模型基本没有,深搜的创造能力就是把数据库蒸馏成知识库之后,诞生的最典型能力。
作为一个生成模型,深搜的创造能力其实是一种作画,但它判断它创造的好坏的能力是不足的,这就是一位”纯粹的天赋型创作选手“。
天赋横溢,但它彻底获得好坏的判断力之前,它不知道哪些创作是好的,哪些创作是坏的,所以它只能写出来一些”仅仅格式正确“的作品。
在自然语言方面的创作,越短的输出,它的判断能力越高,所以水平越高,越长的输出,它的判断能力越差,越流于形式。
这并不是深搜的创作能力不足,而是深搜的判断能力不足,除非你喂给它特别具体的描述,否在它的创作能力根本发挥不出来——这又是我前面说过一次的悖论,当我能够把我的需求细化得特别清楚的时候,大多数时候我自己就能创作出来。因为细化描述本身就是特别具体的创作流程,我又为啥需要深搜呢?
4. 判断能力:深搜的判断能力才是我最为震惊的一点。因为深搜的创作能力只是一种猫打翻墨瓶的”妙手偶得“,只是一种反应。
判断能力已经进入逻辑的范畴了。深搜之前的国内大模型都是近乎没有任何判断能力的,相当于幼儿园选手,但深搜的判断能力已经是小学生了。
当我分析出来这一点,你就知道我是何等的震惊?深搜大家用得都说好,并非前几个能力和国内大模型拉开差距,而是因为它具有了判断能力。
--
经由数理逻辑分析能力,诞生最初步的判断能力,这才是深搜最核心、也是我最为震惊的突破。
为了验证这点,我前天和昨天,自己写了一个网文设定,然后用百度的文心、阿里的千文,反复殴打我自己,想出来的三十多个网文标题。
这是三十多个网文标题,是我迭代了三十到四十次的结果,本身的质量就是缓慢上升的,但又是我不断往不同”起名方向“迭代的结果,其中包含好几个不同的”起名方向“。
我把它们和我最初的网文设定,扔给深搜去判断好坏。你知道吗?深搜真的能分析出来某些名字的好坏,帮我圈出来质量最高的几个网文名字。
国内大模型,仅仅帮我分析每个名字的缺点,也就是找茬它擅长,起名就算了。你让国内大模型提建议,它自以为得意的名字,并没有犯它找茬的毛病,但犯了很多我们人类起名绝对不会犯的毛病——正是因为我们人类不会范那些错误,所以这些约束信息根本没有人往机器里面输入,这就是我说的,现实的约束远比文字中表现出来的更多。
深搜是真的开始判断名字质量的高低了,虽然现在深搜的判断能力还比较初级,很明显是通过”数理分析能力“获得的,但这已经是特别了不起的成就!
就像我说的,我有时间多去永远深搜多好。论坛上太鱼龙混杂,能够达到交流门槛的比例其实不高。
大多数用户不仅是各方面能力都比不上深搜,还特别没自知之明,特别是那些体制内纯粹管理职位诞生的”脱产教士“。
--
贴前面部分名字,证明我并非虚言。相关的上古史我也在论坛写过两次到三次,我现在只是把它变成网文设定,自己起名,然后让国内大模型和深搜来判断好坏。
1《皇天后土之争:血肉精华与工具士兵》
2《皇与后:血肉精华与工具士兵》
3《巫皇与神后:血肉精华与洗脑军团》
4《皇巫与后神:血肉精华与洗脑军团》
5《巫皇神后:血肉精华神药与心灵枷锁军团》
6《神后乱巫皇:血肉精华神药与心灵枷锁军团》
7《巫皇神后之乱:血肉精华神药与心灵枷锁军团》
8《天倾之战:血肉精华神药与心灵枷锁军团》
9《天倾之战:神后的血肉精华神药与巫皇的心灵枷锁军团》
10《天倾之战:神后的血肉精华神药》
11《天倾之战:神后血晶》
12《天倾之战:神后造血华》
13《天倾之战:神后血华乱皇天》
14《天倾之战:神后血晶乱皇天》
15《上古天倾:神后血晶乱皇天》
16《皇天崩溃:神后血晶乱上古》
17《大同崩溃:神后血晶乱上古》
18《三皇五帝:神后血晶乱上古》
19《五帝终焉:神后血华之乱》
20《上古终焉:神后血华之乱》
21《上古终末:神后血华之乱》
22《上古终章:神后血华之乱》
23《终章:神后血华之乱》
24《天倾:神后血华之乱》
25《血华之乱——神后终结上古》
26《血华之乱——神后终上古》
27《血华之乱——神后隔古今》
28《上古之终:神后血华之乱》
29《上古之末:神后血华之乱》
30《天倾之战:神后血华隔古今》
31《天倾:神后血华隔古今》
32《上古天倾:神后血华隔古今》
33《皇天倾覆:神后血华隔古今》
34《皇天倾覆:神后血华隔今古》
35《皇天倾覆:神后血华隔上古》
- 相关回复 上下关系8
🙂感觉西西河到了这类前沿专业领域,信口开河的人有点多 7 bash99 字1338 2025-02-06 06:09:13
🙂大模型是数据库+信息检索的融合,知识抽象程度既看前者也看后者 14 nobodyknowsI 字4429 2025-02-06 10:59:56
🙂正解,应该是突破性的进步 4 曾伴浮云 字741 2025-02-06 20:26:23
🙂创造能力和分析能力是质的飞跃,也有一定程度判断好坏能力
🙂OpenAI的O3-mini涉嫌抄袭DEEPSEEK dudu8972 字129 2025-02-03 18:45:32
🙂在军事斗争、情报收集整理、反间谍太有用了 2 camper 字0 2025-02-02 04:06:12
🙂现在眼见着人力间谍的作用越来越小 1 绝对不是白领 字123 2025-02-06 20:40:41
🙂胡锡进这个帖子里的这句值得关注呀 3 不远攸高 字437 2025-01-30 21:01:21