導讀:IBM 公司 11 月 18 日發(fā)布公告,宣布和 AMD 公司達成合作,計劃在 IBM Cloud 上部署 AMD Instinct? MI300X 加速器服務(accelerators as a service)。
IBM 公司 11 月 18 日發(fā)布公告,宣布和 AMD 公司達成合作,計劃在 IBM Cloud 上部署 AMD Instinct? MI300X 加速器服務(accelerators as a service)。
此項服務預計將在 2025 年上半年推出,目標是提升企業(yè)客戶在生成式 AI 模型和高性能計算(HPC)應用中的性能和能效。
IBM 表示通過此合作,其 watsonx AI 與數(shù)據(jù)平臺,以及 Red Hat Enterprise Linux(RHEL 發(fā)行版)的 AI 推理支持也整合 MI300X 加速器。
IBM Cloud 將提供 AMD Instinct MI300X 加速器,以支持企業(yè)客戶處理計算密集型工作負載。
IT之家援引新聞稿,MI300X 加速器配備 192GB 高帶寬內(nèi)存(HBM3),能夠支持大型模型的推理和微調(diào),幫助客戶以更少的 GPU 運行更大的模型,降低推理成本。
此外雙方將利用 IBM Cloud 的安全性與合規(guī)性能力,以支持各行業(yè)的企業(yè)客戶,尤其是那些受到嚴格監(jiān)管的企業(yè)。