西西河

主题:Grok3-马斯克千倍算力打造跑分没全面领先DeepSeek -- 脊梁硬

  • 共: 💬 3 🌺 18
  • : 💬 2 🌺 1
  • Grok3-马斯克千倍算力打造跑分没全面领先DeepSeek

    马斯克十万块H100 GPU

    计算200天得到的新模型

    使用的算力超过了DeepSeek R1杭州团队的千倍

    北京时间2月18号闪亮发布

    看他的性能评估图

    精心挑选了比较对象,特意(吗)没有对标最新版的deepSeek R1, 而是它的老版本v3

    看常用的比较参数,老米这种大力堆硬件飞砖战略得到的 AI 模型表现不佳。可以说是败给了国人如DeepSeek 的大脑

    为了加入他(刻意)略去的 DeepSeek R1模型,我搜集了有共同对标厂家产品(GPT-4o, Caude-3.5 Sonnet)的参数图表,保证多图表比较有共同参考系。

    DS R1 跑分在左边,三项里领先两项,另外一项接近打平

    科学 Science GPQA: 71.5 : 75

    编程Coding LCB LiveCodeBench: 65.9 : 57

    数学MATH AIME 24: 79.8 :52

    而且DS的稀释小模型32B, 可以普通个人电脑运行的,也 分别达到跑分 62.1,57.2, 72.6 , 也三项里领先两项。

    当然他还有各种吹嘘的深度思索复杂思索能力,不在这些常用跑分覆盖,我们拭目以待吧。

    点看全图

    点看全图

    点看全图

    通宝推:审度,

    本帖一共被 1 帖 引用 (帖内工具实现)
    • Deepseek团队最近又发表了一篇论文,最新技术的能效比

      最新技术的能效比 Grok3 强不少!

    • 我怀疑他明修栈道,暗度陈仓

      这两天有个消息,说马斯克放出话来,要买一百万张显卡,来训练xAI的下一个集群。

      要说这些显卡里没有一部分拿去挖矿,我是不信的。

      马斯克的手已经伸向财政部了,如果诺克斯堡被他查出来有什么群众喜闻乐见的猫腻,那美元就有乐子瞧了。如果美元有个三长两短,那么总得要拿什么去堵缺口,拿什么堵呢?

      巧了,马斯克正是发行doge和trump币的那个靓仔,而他玩币的底气就在于,特朗普的竞选承诺以及上台以后签发的一系列与加密货币相关的行政命令,包括但不限于:

      建立战略比特币储备

      阻止美国政府进一步开发中央银行数字货币

      用加密货币解决美国债务问题,等等

      我们都知道美元与美债一体两面,所以这其实是明牌,就是要用私铸的加密货币代替美元。

      但这个事情只能悄悄滴进村、打枪滴不要,因为如果你大张旗鼓地宣布买一百万张卡就为了挖矿,但凡接受过义务教育都能算得出来,你在某个时期的货币储备会是多少。

      所以grok不尽如人意,也许有技术以外的解释。



有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河