西西河

主题:茗谈149:赤雁 -- 本嘉明

共:💬294 🌺1455 🌵33新 💬64 🌺10 待认可4
全看树展主题 · 分页首页 上页
/ 20
下页 末页
家园 哈哈,老一辈赢学家,大概是怕被新一代赢学家抢生意

果然同行是冤家。

家园 要想以后赢,就少玩阿Q游戏

因为容易产生的副作用就是既然嘴上已经赢了,就不用做事了。

真想赢,你只能比他强。 既要发挥自己肯吃苦,能干活的精神;又要学习对手不要脸,讲究实效的昂撒现实主义手段。 否定自己,是一个痛苦的过程。弃虚名而得实利,如江湖时代那样,是韩信那种真正的勇者和智者。 值得尊重。 操纵一下舆论,让大家开心的又笑了,王毅又教育孙子了。 这种廉价的精神鸦片。是未来想赢的敌人。

家园 huggingface上有完整复制deepseek的训练

https://github.com/huggingface/open-r1

这个项目目前15.2k星,绝对的明星级项目。Huggingface大本营的更新:

https://huggingface.co/blog/open-r1/update-1

在AI开源的大本营, huggingface上有人根据deepseek论文提到的方法,成功重新复现了训练,对论文中没有提到的部分,进行了填补。再把结果和公开部署的deepseek进行benchmark测试对比,我看了一下,各项得分有高有低,但基本一致。学界还有一些人也做了复现,得出的结论完全肯定。

上面的信息充分说明deepseek不是玩假的,从数据到方法,甚至计算原理全部和盘托出,在写代码的人当中,没有一个人敢贬低deepseek。你看,这几天从微软的Azure到Nvidia,都自行部署deepseek R1,无他,推理效率太高了。按照它的价格,不光不亏钱,还赚钱。

至于部分信息杂着chatGPT的东西,很正常。毕竟训练数据是公开的,chatGPT已经公开2年了,网上已经有大量它制造的数据,会污染训练数据源,何况deepseek还允许联网搜索,更可能污染。另一方面,大模型的训练过程中,肯定会和各大模型对接,时不时对同一问题对自己做对比测试,并且把测试结果作为强化训练的一部分,各大模型包括不限于chatGPT,但这和蒸馏无关。这个数据量肯定不到总数据量的1%,我估计0.1%以下,再多,付不起钱啊。就好像一个人学艺归来,找人切磋,学习?是的,但这个学习是双向的。

deepseek的6千多亿参数不可能靠蒸馏而来,任何有脑子的码农都不会相信。因为那要多大的带宽和多大的数据量才能完成啊?光账单就不止1亿美刀了。

再说,openAI这几天公布的o3 mini,思维链频现中文思考过程,它又是偷谁的呢?

对自己不懂的东西千万不要随便听那些殖人,他们恨不得中国完蛋,这种雷霆万钧的突破,在它们那里都变成了蒸馏,盗窃,甚至欺骗,其他科技进步呢?

这些人完全就是用屁股思考。

通宝推:曾伴浮云,青青的蓝,尖石,黄序,exprade,strain2,和平共处,河兮兮,我思故我在,毛毛球,透明,玉米菜,唐家山,草原狼,西电鲁丁,脊梁硬,
家园 【讨论】6000亿参数 -- 有补充

用什么芯片处理?用多少算力处理?结果弄了一年多,总共才花550万美元?

中共中央委员会就有250多人,你这里总共140人的公司,改变14亿人的国运了?

我知道DS有真功夫,但现在全世界同时有那么多人在提问题下达任务,这是多么大的应用规模?你既然是内行,550万美元你也信?

这个小团队,可以把虹桥画得很出彩,但匆匆一年,就把《清明上河图》画成了,这是不可能的。陈兄,咱们都是下午四五点钟的太阳了,你就不要拿几个术语出来,跟真懂真干这行的年轻人的眼光,去硬拗了。假定你说的都是真的,那美国出300人的梦之队,一个亿美元,山寨一把DS的技术路径,是不是有很大可能翻转下一把?

我还是那句话,等DS的升级版。从谷爱凌的国籍,到乌克兰能不能年产100万架,上半场豪情万丈,下半场集体傻眼的事,这河里还少吗?

作者 对本帖的 补充(1)
家园 【整理】F-35与歼-35的对比 -- 补充帖

点看全图

点看全图

点看全图

DeepSeek疑似抄袭

家园 【讨论】国师你不是自我打脸嘛

前一贴信誓旦旦,closeai是一个“开源”的东西。

今天就变成了出了内鬼,机密泄露。

别说跟其他1450统一话术,你踏马的能不能跟自己统一话术。

我都怕所谓的closeai找不到所谓的内鬼,又说closeai开源了。

合着薛定谔的开源是吧?

还有脸提歼35,那都是沈飞的上一代产品了。

现在的沈六代,还有下图这个大杀器,你解释解释,波音是怎么通过时空传输机送给中国人的?

点看全图

通宝推:心远地自偏,
家园 【讨论】052d是有源相控阵雷达

伯克只有刚服役的flight3才用有源相控阵雷达。

家园 怎么没报复?虽然晚了七八年,总算用昂撒能听懂的语言来交流了

2月4日,商务部和海关总署联合发布公告称,为维护国家安全和利益、履行防扩散等国际义务,经国务院批准,决定对钨、碲、铋、钼、铟相关物项实施出口管制。

国务院关税税则委员会4日发布公告表示,自2025年2月10日起,对原产于美国的部分进口商品加征关税。公告表示,2025年2月1日,美国政府宣布以芬太尼等问题为由对所有中国输美商品加征10%关税。美方单边加征关税的做法严重违反世界贸易组织规则,不仅无益于解决自身问题,也对中美正常经贸合作造成破坏。

公告明确,自2025年2月10日起,对原产于美国的部分进口商品加征关税:对煤炭、液化天然气加征15%关税,对原油、农业机械、大排量汽车、皮卡加征10%关税,具体商品范围见公告附件;对原产于美国的附件所列进口商品,在现行适用关税税率基础上分别加征相应关税,现行保税、减免税政策不变,此次加征的关税不予减免。

家园 从流体力学的角度回答一下

先说结论:如果中国的六代机的巡航高度是2万米到3万米,巡航速度超高2马赫,那么就不需要狗斗,也不需要躲导弹。

因为美国没有高空高速的风洞。大家知道高空的空气密度低,所以针对高空的风洞要通过密封环境保持特殊的空气密度。而且由于现在计算能力有限,所有的高空速度下都要在风洞里一点点吹出来,来保证在设计要求内的各种速度导弹或飞机可以稳定飞行。这东西算不出来,只能一点点吹。这种东西是不可能闭着眼睛设计出来的,没吹过一定不能稳定飞行。

所以现在美国所有的飞机,导弹是不能这2万米到3万米,以2马赫以上的速度作战的。

所以美国想在这个高度跟tg斗,需要先建好高空高速风洞,然后一点点吹,最起码吹十年,才有可能。

所以南六代才会造的很大,因为有恃无恐。歼轰比歼击更可怕。

家园 【讨论】还搁那儿尬吹乌克兰无人机

国师你信誓旦旦乌克兰年产400万架无人机,另外一个殖人马前卒也吹400万架无人机。

结果今天又成了100万,在加麻大

100=400?

加麻大的数学都进化到这个地步了?

你是打你自己的脸么,我看小泽和马前卒的脸也被你抽肿了。

好好品一下自己拉的屎,别下一贴又说乌克兰年产400万架无人机。

里外里可差着三百万架无人机呢。折合俄罗斯人头,那也是三百万呢。

事实证明,国师反正是编造数字,我这要你证明100=400,反正你踏马的是自由心证,等于就等于吧。

家园 拿西西河当寺庙天天许愿来了
通宝推:金银鑫,投桃报李,
家园 高空是不需要的,关键是低空阶段,恐怕还需要狗斗的

当然了,有蛋蛋时期不需要,咱们超视距发现。

会不会有电子干扰呢,也很可能的。

看吧。

家园 【讨论】美国中部千万人口城市是哪个?

我只强调过乌克兰可以年产100万架无人机,当时各位理科男各种群嘲,结果年底一盘点,人家自产120万。

【讨论】年底盘点

至于梦中的年产400万架,那肯定是美国中部千万人口大城市替乌克兰代工的,您那时候天天坐着通勤小火车去代工厂上班,为乌克兰人民的伟大事业呕心沥血着呢。

对了,想起来那地儿叫什么了吗?雷克雅未克格勃?

家园 【整理】补图 -- 补充帖

点看全图

家园 【讨论】美国中部千万人口的大城是哪个?

假扮成左派的极右

二连浩特苏仑?

家园 【讨论】所以你也倾向于是歼轰?

我的意思很清楚,科技发展到这个阶段了,该上歼轰就上歼轰。单纯的歼击机很可能已经过气了,那就封印结界,把“歼击”这个美好的名头和回忆,都留给它,开走下一段长征路。

全看树展主题 · 分页首页 上页
/ 20
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河