算力江湖,硝煙四起。
6月14日凌晨,AMD在舊金山的發布會上推出了新一代AI芯片、數據中心CPU以及DPU。在生成式AI浪潮之下,最受關注的新品莫過于AI芯片Instinct MI 300X,直接對標英偉達H100。
(資料圖片)
AI也是本場發布會的關鍵詞。AMD CEO蘇姿豐在會上談道,目前仍處于AI生命周期非常非常早的階段。AI加速卡的市場空間將從2023年的300億美元增長到2027年的1500億美元,年復合增速超過50%。
AI世界滾滾向前,芯片界的老對手們也摩拳擦掌,欲奪取王冠上的明珠。在當前GPU制霸的AI芯片市場上,英偉達一騎絕塵,隨著AMD新系產品線的亮相,AMD也將成為AI戰場上的有力競爭者。
值得注意的是,芯片平臺之外,AMD也在加大軟件生態的投入,欲在軟硬件雙線上和對手們一較高下。不過眼下戰況依然激烈,從當天股價看,AMD下跌3.6%,英偉達股價則上漲近4%,市值超過1萬億美元。
盡管挑戰不小,在過去的十年中,蘇姿豐帶領AMD逆襲重生,如今在AI角力場上能否開啟新的故事,業內外皆拭目以待。
AMD的AI野心近年來,AMD一直在全面強化自身的算力。通過收購ATI、Xilinx、Pensando,AMD逐步拓展產品矩陣,成為一家集CPU、GPU、DPU、FPGA于一身的芯片企業。
在AI領域,AMD此次發布了Instinct MI 300系列的新產品;在CPU領域,AMD也推出了EPYC的一系列更新,包括新一代數據中心CPU第四代EPYC處理器Genoa、針對云原生計算的第四代EPYC處理器Bergamo以及EPYC處理器Genoa-X。
其中,AMD Instinct MI 300系列成為關注焦點。在發布會上,AMD正式推出Instinct MI 300X,一款專門面向生成式AI的加速芯片,擁有1530億個晶體管。事實上,AMD在早些時候已經公布了該系列的首代產品Instinct MI 300A,它擁有1460億個晶體管。
兩者不同之處在于,Instinct MI 300A是將CPU和GPU以chiplet的方式集成到一個芯片,并采用統一的內存架構,即采用了CPU+GPU的架構,對標的是英偉達的GH200;而來到最新款的Instinct MI 300X,則沒有集成CPU內核,為GPU芯片,對標英偉達的H100。
盡管英偉達的GPU十分強勁,但是AMD的MI 300X有其優勢,尤其在存儲性能上。據悉,MI 300X芯片算力較MI 300A更加強大,其HBM(高帶寬存儲器)容量及顯存帶寬,分別是英偉達H100的2.4倍及1.6倍,由于HBM容量大幅提升,單顆MI 300X芯片可以運行800億參數模型。
不過MI 300系列芯片距離實際應用還需要一定時間,其中,MI 300A芯片目前已經向客戶送樣,MI 300X芯片將在今年第三季度送樣。
隨著大模型的玩家越來越多,以GPU為代表的AI芯片需求不斷增加。根據Precedence Research數據,2022年全球AI芯片市場規模為168.6億美元,將以每年約30%的速度增長,預計到2032年達到約2274.8億美元。
面對新的機遇,AMD也在不斷升級,一方面是持續進化芯片性能,另一方面也在構建軟件生態能力。正如CUDA是英偉達堅固的護城河,AMD正在打造開放的ROCm平臺。據介紹,AMD擁有一套完整的庫和工具ROCm,可以用于其優化的AI軟件堆棧,而在過去的發展中,公司也在不斷優化ROCm套件。
在會上,蘇姿豐說道:“人工智能是塑造下一代計算的決定性技術,也是AMD最大的戰略增長機會。”
挑戰英偉達從MI 300A到MI 300X,AMD不斷向英偉達發起挑戰,攻勢十足,不過當前競爭環境依然激烈。
一方面,英偉達憑借著數十年在加速計算領域的積累,壁壘高企,多位業內人士向21世紀經濟報道記者指出,目前在AI訓練芯片中,英偉達依然占據著九成市場。
僅以AI服務器的場景為例,TrendForce集邦咨詢向記者提供數據顯示,預計英偉達GPU為AI服務器市場搭載主流,市占率約60%~70%,其次為云端業者自主研發的ASIC芯片,市占率逾20%。
TrendForce集邦咨詢還稱,下半年ChatBOT及AI運算風潮將持續滲透至各種專業領域(如云端/電商服務、智能制造、金融保險、智慧醫療及智能駕駛輔助等)的開發市場,同步帶動每臺搭配4-8張GPU的云端AI服務器,以及每臺搭載2-4張GPU的邊緣AI服務器應用需求漸增,預估今年搭載A100及H100的AI服務器出貨量年增率逾五成。
芯片行業專家姚嘉洋向21世紀經濟報道記者表示:“英偉達在GPU架構的迭代上,一直都有屬于自己的發展路徑,這幾年的發展,也讓英偉達躍居AI算力芯片領域的領導者地位,在AI算力領域上,AMD和Intel近年來都是處于苦苦追趕的情況。”
他進一步指出,英偉達在AI領域,很早就導入了Tensor運算單元(張量運算,是深度學習運算加速的核心),提升AI算力,這是英偉達在奠定AI計算芯片領先地位過程中很重要的一步。
在十多年前,外界談及英偉達挑戰時,總會提及英特爾、AMD進入到GPU市場帶來的競爭。而現在隨著英偉達量產Grace CPU,英特爾和AMD深受影響。也有專家向記者指出,多年前英偉達提供GPU訓練alexnet以及谷歌TensorFlow的時候,AMD大概落后兩年左右,英特爾也未見突破,隨后軟硬件生態之間的差距進一步拉大。
另一方面,英偉達十年磨一劍打造了CUDA軟件生態帝國,而AMD ROCm相比英偉達也是CUDA起步較晚。
關鍵詞: