HBM3
科技
META:Llama 3模型訓練平均每3小時故障一次 GPU問題占最大類
據科技媒體 tomshardware 報導,Meta (META-US) 最近發布了一項研究,詳細介紹了在包含 16,384 個 Nvidia(NVDA-US) H100 80GB GPU 的叢集上運行的 Llama 3 405B 模型訓練。
美股雷達
路透:三星HBM晶片因發熱問題 未通過輝達測試
《路透》週四 (23 日) 報導,因發熱問題,三星高頻寬記憶體 (HBM) 未能通過輝達 (MVDA-US)測試。三位消息人士稱,自去年以來,三星一直在努力通過輝達對 HBM3 和 HBM3E 的測試。消息人士透露,最近對三星 8 層和 12 層 HBM3E 晶片的失敗測試結果已於 4 月公布。
2024-07-29
2024-05-24