您现在的位置是:知识 >>正文
ChatGPT有多烧钱?大模型训练一次200-1200万美元
知识2686人已围观
简介来源:IT之家 IT之家 2 月 19 日消息,ChatGPT 风靡全球后,科技巨头们纷纷入局,生成式 AI 其背后以大模型为基础的人工智能成为业界投入的方向。IT之家了解到,所谓“大模型”,通常是在 ...
来源:IT之家
IT之家 2 月 19 日消息,多烧ChatGPT 风靡全球后,模型美元科技巨头们纷纷入局,训练生成式 AI 其背后以大模型为基础的次万人工智能成为业界投入的方向。
IT之家了解到,多烧所谓“大模型”,模型美元通常是训练在无标注的大数据集上,采用自监督学习的次万方法进行训练。之后在其他场景的多烧应用中,开发者只需要对模型进行微调,模型美元或采用少量数据进行二次训练,训练就可以满足新应用场景的次万需要。
然而,多烧训练通用大模型非常“烧钱”。模型美元据国盛证券报告《ChatGPT 需要多少算力》估算,训练GPT-3 训练一次的成本约为 140 万美元,对于一些更大的 LLM(大型语言模型),训练成本介于 200 万美元至 1200 万美元之间。以 ChatGPT 在 1 月的独立访客平均数 1300 万计算,其对应芯片需求为 3 万多片英伟达 A100 GPU,初始投入成本约为 8 亿美元,每日电费在 5 万美元左右。
如果将当前的 ChatGPT 部署到谷歌进行的每次搜索中,需要 512820.51 台 A100 HGX 服务器和总共 4102568 个 A100 GPU,这些服务器和网络的总成本仅资本支出就超过 1000 亿美元。
国盛证券认为,在公有云上,对于以谷歌等全球科技大企业而言,百万至千万美元级别的训练成本并不便宜,但尚在可接受范围内、并非昂贵。
Tags:
相关文章
2022中国科幻大会将于11月29日在京举办
知识今天11月22日),记者从2022中国科幻大会新闻通气会上获悉,第六届中国科幻大会将于11月29日至12月2日在北京首钢园区举行。今年中国科幻大会的主题为“科学梦想,创造未来”。据悉,2022年是中国 ...
【知识】
阅读更多特朗普给出一份名单
知识美国国会众议院调查“国会山骚乱”事件特别委员会下简称“特别委员会”)21日召开第四场听证会。证词显示,特朗普及其团队曾试图给关键摇摆州领导人施压,以在推翻选举结果后,让选民投票选出其“内定”的选举人。 ...
【知识】
阅读更多证监会拟修改多部规章和规范性文件:券商从事股票期权经纪业务准入方式改为“核准制”
知识今日6月24日),证监会官网发布消息,为做好《中华人民共和国期货和衍生品法》以下简称《期货和衍生品法》)的贯彻落实工作,证监会起草了《关于修改部分证券期货规章的决定》《关于修改部分证券期货规范性文件的 ...
【知识】
阅读更多