- 近期网站停站换新具体说明
- 按以上说明时间,延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间
主题:茗谈149:赤雁 -- 本嘉明
我不是专家,但蒸馏的含义其实很简单。
就是有了一个模型,然后再继续训练它,得到一个在某个方面更好的模型。
这就是为什么说只可能蒸馏Open source。
比如说,deepseek 蒸馏了llama, qwen,因为那些都是open source
蒸馏Chatgpt绝无可能,除非去偷了它的模型。
其实Deepseek-R1是从deep seek-V2,V3来的,脉络很清楚。不会去蒸馏另外的模型。
有人怀疑它用到了Chatgpt的一些结果,违反了用户协议,因为chatgpt不允许用它的结果训练LLM。
我其实是相信各个LLM都会相互借鉴。但是,第一这个不可能有证据,就是莫须有,第二Open AI已经说了不会追究。最重要的是,即使有,也是整个训练数据集中很小很小的一部分,没有它,也不会有影响。
- 相关回复 上下关系8
压缩 5 层
🙂蒸馏只可能蒸馏Open source的 9 老虎008 字0 2025-02-05 12:38:13
🙂你不懂什么是蒸馏 2 向前向前 字90 2025-02-06 11:46:08
🙂他的意思应该是不开源负担不起 10 陈王奋起 字251 2025-02-07 00:22:11
🙂什么是蒸馏
🙂请教一下:LPU到底有没有前途? 拜吨 字693 2025-02-07 20:59:06
🙂取决于如何定义LPU 5 陈王奋起 字416 2025-02-07 23:27:48
🙂碰到懂技术的了。 他估计是搞成了PPO 1 戒定慧 字0 2025-02-07 08:24:42
🙂陈王是懂相关技术的人,老虎河友也是 53 方平 字1792 2025-02-07 03:28:45