主题:转个有意思暴论:英语是自带半文盲debuff的种姓隔离圣体 -- 划水的鱼
- 共: 💬 84 🌺 569 🌵 12
- 新: 💬 2 🌺 1
正巧陈经发了个文(陈大是不是还在河里混啊,所以跟这个帖子呼应了)
有几段比较有意思
4. 近期大模型让全球进一步认识到了汉字的优势,有的西方大模型居然用汉字思考了。不少西方人惊讶,在受到严重限制的情况下,中国居然迅速在大模型上取得了突破。有的西方使用者评论说,deepseek在英文“创意写作”上表现极好。这是汉字体系优势的另一个表现,而且更为本质。
6. Deepseek的性能进步,除了大模型数据结构、训练算法、代码优化,新闻里没有说的,是对中文训练数据的整理、评估。业界传Deepseek非常重视数据标注,梁文锋自己都来打标,请北大中文博士来打标。高质量的数据,就象严师,让Deepseek R1有了非常强大的中文能力。它似乎以中文思维为底座,有了不一样的灵活思维,群众普遍反应和以前的大模型不一样。即使用英文输出,在创新写作上也能表现出能力。
7. 因此,Deepseek取得性能突破,很可能受益于中文体系。一个简单的事实是,只有中文和英文能够以自己为主,构建对人类知识体系的完整理解。许多语言甚至连科学词汇都没有,生造新词也不行,还不如改学英文或中文。
陈经也算是一个正经的中科大计算机系毕业,香港科技大学的计算机硕士。他应该不至于无缘无故胡言乱语吧。
- 相关回复 上下关系8
压缩 2 层
🙂中文的信息嫡明显更高一些,信息庶呢? 1 桥上 字0 2025-02-18 07:06:10
🙂“AI用中文思考”可能是这个原因 darkbuddy 字476 2025-02-17 20:43:31
🙂AI用数学进行分析 3 Swell 字700 2025-02-17 11:43:02
🙂我明确说了我对AI分析逻辑确实不懂,所以真心继续请教
🙂胡言乱语谈不上 2 Swell 字874 2025-02-18 16:18:56
🙂作为语言,信息嫡越高越好吗? 2 北京北京 字907 2025-02-17 09:54:50
🙂一码归一码,对AI模型来说 不会追求信息熵低, 自由呼吸F0 字166 2025-02-17 21:01:36
🙂真够扯的 13 绝缘体1 字202 2025-02-16 14:39:36