西西河

主题:茗谈149:赤雁 -- 本嘉明

共:💬316 🌺1597 🌵35新 💬64 🌺8 待认可1
全看分页树展 · 主题 跟帖
家园 你太外行了

模型的训练成本,是一次训练的成本。就是该版本模型从头开始,训练到当前发布权重所花的GPU时间。

你多看几篇大模型的论文,比如meta的llama3.0的,里面都会说自己一次训练成本是多少。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河