微软和NVIDIA共同推出迄今为止训练的最大且最强的语言模型 - cnBeta.COM 移动版(WAP)

返回上一页首页 | cnbeta报时: 03:29:29

微软和NVIDIA共同推出迄今为止训练的最大且最强的语言模型

发布日期:2021-10-11 23:52:46 稿源：cnBeta.COM

微软和英伟达今天宣布了由DeepSpeed和Megatron驱动的Megatron-Turing自然语言生成模型（MT-NLG），这是迄今为止训练的最大和最强大的解码语言模型。这个模型包括5300亿个参数，与现有最大的模型GPT-3相比，参数数量是其3倍。

训练这样的大型模型涉及各种挑战，沿着所有的人工智能轴线进行了许多创新和突破。例如，通过紧密合作，英伟达和微软将最先进的GPU加速训练基础设施与尖端的分布式学习软件堆栈相融合，实现了前所未有的训练效率。

微软与NVIDIA建立了高质量的自然语言训练语料库，其中包含数千亿个标记，并共同开发了训练配方，以提高优化效率和稳定性。

您可以从这里了解更多：

https://www.microsoft.com/en-us/research/blog/using-deepspeed-and-megatron-to-train-megatron-turing-nlg-530b-the-worlds-largest-and-most-powerful-generative-language-model/

https://developer.nvidia.com/blog/using-deepspeed-and-megatron-to-train-megatron-turing-nlg-530b-the-worlds-largest-and-most-powerful-generative-language-model/

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道，更好阅读体验，更及时更新提醒，欢迎前来阅览和打赏。

查看网友评论返回完整版观看

最新资讯

加载中...

全球DRAM抢货战愈演愈烈三星内查供货过程员工吃回扣丑闻

黄仁勋：英伟达尚未支付OpenAI一分钱

台积电核心技术不会外流给美国落后两代才能出海

2025年AI耗电与耗水激增新研究呼吁科技巨头公开环境账本

2026年智能手机价格料将上涨全球出货恐再度下滑

AMD Zen 6获GCC 16编译器支持开源优化提前锁定2026新平台

台积电加速美国布局亚利桑那第二厂预计2027年投产3纳米芯片

AMD 5800X3D二手价反超7800X3D 全怪DDR5

C罗进军好莱坞《速激》演员欢迎新家人剧照疑似AI

卡梅隆准备重启《终结者》

模拟芯片大厂ADI宣布涨价最高幅度30%

今日最热

加载中...

拼多多与中国监管人员发生肢体冲突后大幅裁撤政府事务团队

模型免费、推理翻倍：Gemini 3 Flash发放智能体时代的“入场券”

55岁三星长公主李富真露面腿脚不便引关注

小轿车高速上定速巡航、刹车失灵 115km/h时速跑490公里耗干油箱才停下

高速突发“幽灵刹车”罪魁祸首竟然是车漆

iOS 26.3首个公测版发布：苹果、安卓正式互通可互传数据

苹果首款折叠屏iPhone渲染图：阔折叠比例内屏无开孔

罗永浩吐槽上海电信：千兆宽带实际不足百兆再不解决要发疯

今起海南自贸港全岛封关：免税叠加优惠iPhone 17最高可减2140元

日版App Store大改引入第三方应用商店与支付选项

又见Windows内存刺客 Windows 11关键功能悄悄占用大量内存

返回上一页首页 | cnbeta报时: 03:29:29

文字版标准版电脑端

© 2003-2025