大模型时代的异构计算平台 - オンラインツール

オンラインツール

オンラインツール

反馈

オンラインツール

ホーム話題

ライブラリコードベースお店

詳細表示

大模型时代的异构计算平台

出处：mp.weixin.qq.com

摘要

GPT-3 有 1750 亿参数，文心大模型有 2600 亿参数。以使用 NVIDIA GPU A100 对 GPT-3 进行训练为例，理论上单卡需要耗费 32 年的时间，千卡规模的分布式集群，经过各种优化，仍然需要 34 天才能完成训练。

阅读原文

xiaozi 于 2023-02-23 分享

4457

关联话题： #百度

欢迎在评论区写下你对这篇文章的看法。

评论

据说喜欢分享的,后来都成了大神

国别域名注册8折优惠

vultr activity

tencent

小时候做过的最蠢的事，可能是盼着长大吧。

文库

更多

ホーム - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-26 15:16
浙ICP备14020137号-1 $お客様$