- 近期网站停站换新具体说明
- 按以上说明时间,延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间
主题:茗谈149:赤雁 -- 本嘉明
模型的训练成本,是一次训练的成本。就是该版本模型从头开始,训练到当前发布权重所花的GPU时间。
你多看几篇大模型的论文,比如meta的llama3.0的,里面都会说自己一次训练成本是多少。
- 相关回复 上下关系8
压缩 5 层
🙂扎心了 11 潜望镜 字271 2025-02-05 04:19:24
🙂人家利用的就是一张黄皮而已 12 梓童 字426 2025-02-05 01:59:23
🙂【讨论】6000亿参数 2 本嘉明 字987 2025-02-04 19:14:19
🙂你太外行了
🙂【讨论】请查一下李飞飞 本嘉明 字0 2025-02-06 15:58:44
🙂国师对很快要成为美国人了作何感想 guillaume 字50 2025-02-07 01:03:06
🙂你真是要让人笑掉大牙不成 ? 6 雪夜弓刀 字507 2025-02-06 21:26:33
🙂【讨论】我说得很清楚了 本嘉明 字885 2025-02-06 22:55:40