2023年伊始,資本市場的關(guān)注點明顯變了,AIGC逐漸成為這一輪大行情的全新焦點。今年以來,從國外的AUTOGPT到國內(nèi)的文心一言,再到華為的盤古大模型、訊飛星火大模型等紛紛推出,呈現(xiàn)出一派你方唱罷我方休的姿態(tài)。
盡管參與者甚眾,但目前為止這些應(yīng)用,離真正的落地還相距甚遠(yuǎn)。實際上,不論是哪家公司訓(xùn)練大模型,都離不開天文數(shù)字的海量算力支持,因此當(dāng)前能夠真正從AI大模型中獲益的,更可能是為大模型訓(xùn)練提供算力支持的高性能算力廠商和服務(wù)器廠商。
ChatGPT拉動算力持續(xù)飆升
在AI大模型飛速發(fā)展之下,單個大語言訓(xùn)練驅(qū)動AI訓(xùn)練服務(wù)器需求約2億美元,AI推理服務(wù)器方面,如ChatGPT在初期便可帶動推理服務(wù)器需求約45億美元。而各種ChatGPT的爆發(fā),更讓它背后的AI服務(wù)器隨之水漲船高。
具體而言,算力作為大模型的核心引擎,它的計算方式既簡單又粗暴,即實際擁有多少的GPU芯片,將直接決定其算力的大小。并且ChatGPT所需要的算力不是固定的,反而是逐次遞增的,這就意味著ChatGPT越聰明,其背后所需要的算力就越多,而供需雙方存在的現(xiàn)實差距,則讓算力資源的“緊張問題”變得愈加嚴(yán)重起來。
從需求側(cè)來看,大模型參數(shù)量的持續(xù)增大,需要更多算力資源予以支持。從大模型自身的發(fā)展?fàn)顩r來看,參數(shù)量的變化是一個非常值得關(guān)注的指標(biāo)。從最早的ResNet、inception等模型,到如今的GPT模型,大模型的參數(shù)量不斷壯大。
數(shù)據(jù)顯示,2018年前后OpenAI先后推出Transformer和GPT-1模型,參數(shù)量在1億級別;隨后谷歌提出3億參數(shù)的BERT模型,參數(shù)量再次增長。2019、2020年OpenAI加速追趕,陸續(xù)迭代出GPT-2、GPT-3模型,參數(shù)量分別為15億、1750億,實現(xiàn)模型體量質(zhì)的飛躍,而阿里達摩院旗下的多模態(tài)大模型M6的參數(shù)量,更是達到了萬億甚至10萬億的量級,數(shù)據(jù)量加速指數(shù)級攀升之下,其所需算力自然也需要指數(shù)級提升。
從供給側(cè)來看,大模型參數(shù)量不斷增大之下,參數(shù)運算需要大規(guī)模并行計算的支持,而它取決于底層GPU內(nèi)存容量。OpenAI預(yù)計人工智能科學(xué)研究要想取得突破,所需要消耗的計算資源每3—4個月就要翻一倍,資金也需要通過指數(shù)級增長獲得匹配。在算力方面,GPT-3.5在微軟Azure AI超算基礎(chǔ)設(shè)施(由GPU組成的高帶寬集群)上進行訓(xùn)練,總算力消耗約3640PF-days。
在大數(shù)據(jù)方面,GPT-2用于訓(xùn)練的數(shù)據(jù)取自于Reddit上高贊的文章,數(shù)據(jù)集共有約800萬篇文章,累計體積約40G;GPT-3模型的神經(jīng)網(wǎng)絡(luò)是在超過45TB的文本上進行訓(xùn)練的,數(shù)據(jù)相當(dāng)于整個維基 百科英文版的160倍。就ChatGPT而言,需要TB級的運算訓(xùn)練庫,甚至是P-Flops級的算力,需要7-8個投資規(guī)模30億、算力500P的數(shù)據(jù)中心才能支撐運行??傊?,在大模型持續(xù)發(fā)展之下,ChatGPT的競爭焦點逐漸轉(zhuǎn)到了AI超級算力上,或者是包括GPU在內(nèi)的算力資源支持上。
礦卡風(fēng)口再次來臨
在行業(yè)算力需求持續(xù)飆升之下,以英偉達等為主的核心高性能芯片廠商,已經(jīng)享受到了作為ChatGPT“賣鏟人”的收益,再次迎來了曾經(jīng)互聯(lián)網(wǎng)大爆發(fā)時期的那種礦卡風(fēng)口。以英偉達的旗艦芯片H100為例,其在短短一周之內(nèi),漲價近7萬元人民幣,售價普遍高達30萬左右,次旗艦A100芯片在短短三個月多時間里,從6萬元一路漲至9萬元,漲幅超過50%。盡管其產(chǎn)品不斷漲價,但訂單依然是供不應(yīng)求。
一方面,是英偉達作為硬件霸主,不僅在消費級市場占據(jù)大部分市場,還是AI服務(wù)器芯片領(lǐng)域的頭號選擇,因此其成為很多“渴望”大算力企業(yè)的優(yōu)先選擇。據(jù)此前公開的數(shù)據(jù)顯示,截至2022年第三季度,英偉達在獨立顯卡市場的份額或已經(jīng)達到了88%,顯卡部分帶來的營收占到了其總營收的60%以上,這表明其依然是消費級顯卡市場無可爭辯的領(lǐng)導(dǎo)者。
基于其在圖像處理器領(lǐng)域的強勢地位和核心技術(shù),其AI大算力芯片在大模型爆發(fā)之后,始終處于“供不應(yīng)求”的狀態(tài),特別是ChatGPT從國外蔓延到國內(nèi)的過程中,越來越多的國內(nèi)互聯(lián)網(wǎng)企業(yè)選擇跟隨,其中以BAT為首出現(xiàn)了超過10家企業(yè)宣布推出大模型的計劃。按照ChatGPT的水準(zhǔn),至少需要3000枚A100芯片,以9萬/枚的價格來算就是2.7億人民幣才能完成一個大模型部署;10個大模型就需要3萬枚A100芯片,27億人民幣,加上后續(xù)訓(xùn)練成本,這將會是一個天文數(shù)字。
另一方面,由于受到政策層面的影響,高端AI芯片“斷供”的風(fēng)險劇增,也可能會導(dǎo)致一部分大模型企業(yè)提前囤積芯片,導(dǎo)致相關(guān)的芯片用量激增。其實,早在去年8月,美國政府就發(fā)布出口管制政策,禁止英偉達將A100、H100兩款芯片售往中國。為了應(yīng)對制裁并且不丟掉市場份額,英偉達先后推出了“閹割版”的A800、H800兩款芯片。但這兩款芯片依舊被暴增的市場需求一搶而空,市場價格隨之水漲船高。
在科技制裁之下,預(yù)計國內(nèi)相關(guān)的想要布局AI大模型訓(xùn)練的公司,或許會加速囤積相關(guān)的芯片,從而帶來新一輪的AI算力芯片爭奪戰(zhàn)。
國產(chǎn)替代跑步前進,但仍有高墻難越
從目前來看,盡管國內(nèi)使用英偉達GPU服務(wù)器的占比較高,且在當(dāng)前AI大模型發(fā)展勢頭之下,英偉達具有壓倒性優(yōu)勢。但國產(chǎn)企業(yè)頂著壓力,依然跑出了幾匹黑馬。根據(jù)IDC最新發(fā)布的《中國加速計算市場(2021年下半年)跟蹤報告》,2021年全年中國AI服務(wù)器市場規(guī)模達350.3億元,同比增長68.6%。在企業(yè)級GPU芯片領(lǐng)域,中國廠商壁仞科技在2022年推出“BR100”芯片、天數(shù)智芯推出了“智鎧100”芯片、寒武紀(jì)推出了“思元270”芯片。
其中壁仞科技稱,BR100擁有全球最高算力,峰值算力達到了市場在售旗艦產(chǎn)品的三倍以上,16位浮點算力達到1000T以上、8位定點算力達到2000T以上,單芯片峰值算力達到PFLOPS級別。這些消息,對于身處美國從設(shè)備、材料到技術(shù)全面封鎖之中的中國企業(yè)而言,應(yīng)該算是一個可喜的消息,但想要翻越英偉達這座高山顯然也并不容易。
首先,在AI芯片設(shè)計上,國產(chǎn)廠商與海外巨頭的差距雖然縮小了,但在AI大生態(tài)上的差距卻依然存在。比如,壁仞科技的芯片算力數(shù)據(jù)雖好,但缺少至關(guān)重要的處理FP64的能力,依然無法完全取代英偉達的H100、A100。并且,英偉達使用的CUDA平臺早已成為應(yīng)用最為廣泛的AI開發(fā)生態(tài)系統(tǒng),只支持英偉達的Tesla架構(gòu)GPU,在現(xiàn)階段根本無法用國產(chǎn)芯片取代,因為它涉及到AI芯片的軟件生態(tài)建設(shè)、基礎(chǔ)架構(gòu)等,都還掌握在巨頭手中,目前我們還沒辦法在硬件編程模型上找到替代方案。
其次,在地緣政策背景下,國內(nèi)目前還無法在AI芯片的全產(chǎn)業(yè)鏈實現(xiàn)獨立自主,卡脖子領(lǐng)域仍然很多。過去幾年,美國圍繞中國芯片產(chǎn)業(yè)的“科技圍堵”有增無減,從開始的限制材料、設(shè)備,到后來的全產(chǎn)業(yè)鏈動員封殺,《芯片法案》的頒布正是其科技打壓的集中呈現(xiàn)。而在此背景下,國內(nèi)芯片產(chǎn)業(yè)替代所需要的EDA工具、代工制造和先進封裝等方面的問題,將面臨更為嚴(yán)峻的現(xiàn)實考驗,想要在短期之內(nèi)進行全產(chǎn)業(yè)鏈替代并不容易。
目前來看,無論是解決生態(tài)問題,還是解決產(chǎn)業(yè)鏈自主問題都需要時間,后者的實現(xiàn)尤其需要一番功夫。
AI芯片國產(chǎn)化替代破局點在哪兒?
不過從解決問題的角度來說,國產(chǎn)替代也絕非沒有機會,至少從國內(nèi)當(dāng)前的信創(chuàng)產(chǎn)業(yè)基礎(chǔ)和數(shù)據(jù)應(yīng)用來看,國內(nèi)市場更有可能利用前端市場的創(chuàng)新來逆向底層定制,從而走出一條自己的路。即便是在當(dāng)下,也有一些暫時性的替代方案和思路。
一是定向的國產(chǎn)扶持路徑。對于國產(chǎn)廠商來說,如果它不通過定向合作的方式,很難通過“單打獨斗”來做事情,因為外國企業(yè)都會有自己的軟件架構(gòu),然后整個產(chǎn)業(yè)都適配這個架構(gòu),從而形成一個完整的生態(tài),這種情況下“從零做起”完全是“費力不討好”的事情。因此,要想推動國產(chǎn)廠商的崛起,就需要先通過與頭部國產(chǎn)AI芯片制造商長期綁定合作,推動自主企業(yè)軟件架構(gòu)的形成,然后以該架構(gòu)為主線,逐漸建立起覆蓋上下游的應(yīng)用生態(tài)。
當(dāng)然,這種路徑也有時間周期。據(jù)中信證券研報顯示,GPU IP自研需要36-48個月以及200個工程師,而采用外購IP的方式,則需要12-18個月開發(fā)周期,總體上時間都不算短。
二是通過兼容CUDA生態(tài)做延伸。相比自研系統(tǒng),兼容CUDA系統(tǒng)則可以迅速切入國際主流的商業(yè)計算軟件和人工智能軟件,通過接入豐富的軟硬件生態(tài),可廣泛應(yīng)用于大數(shù)據(jù),人工智能、商業(yè)計算等應(yīng)用領(lǐng)域。
對比兩種方法來看,目前較為可行的方案還是第二種,但從長遠(yuǎn)來看還是做兩手準(zhǔn)備。這樣才能夠未雨綢繆,為將來的全面替代做鋪墊。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,
個人創(chuàng)業(yè)需要啟動成本低、無需龐大團隊、可快速驗證、能利用個人技能或資源。這里分享適合個人創(chuàng)業(yè)的十個機會一.AI內(nèi)容優(yōu)化與本地化服務(wù)·做什么:幫助企業(yè)或個人利用AI工具(如GPT-4,Midjourney)優(yōu)化內(nèi)容生產(chǎn)流程。例如,為跨境電商撰寫多語言產(chǎn)品描述,為小紅書博主生成爆款文案,為小公司制作營銷
百度AI團隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標(biāo)志著OCR領(lǐng)域首次實現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準(zhǔn)識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場
導(dǎo)航網(wǎng)站的崛起:從信息過載到精準(zhǔn)觸達隨著全球AI工具數(shù)量爆發(fā)式增長(2025年已超數(shù)萬款),用戶面臨前所未有的選擇困境。傳統(tǒng)搜索引擎的“關(guān)鍵詞-鏈接”模式難以應(yīng)對工具篩選的場景需求,垂直化、場景化的AI導(dǎo)航網(wǎng)站應(yīng)運而生。這類平臺通過聚合、評測、分類與推薦四重機制,將分散的工具資源整合為結(jié)構(gòu)化入口。例
當(dāng)微信公眾號文章中出現(xiàn)一個人的名字,它會自動變成藍色鏈接,點擊即可查看AI生成的“個人簡歷”——這一微信新功能讓不少用戶感到被“扒光”在互聯(lián)網(wǎng)上。近日,微信新上線的“AI搜索”功能陷入隱私泄露爭議漩渦。多位網(wǎng)友在社交平臺反映,當(dāng)微信公眾號推文中出現(xiàn)本人姓名時,名字會自動變?yōu)樗{色超鏈接,點擊即可瀏覽由
在數(shù)字化與智能化深度交織的時代浪潮中,安全的邊界不斷延展,技術(shù)的演進正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會在北京盛大召開。來自國家部委、院士學(xué)者、高校科研機構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)
2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,
我覺得我們AI的目標(biāo)是:從芯片設(shè)計到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達造車、國產(chǎn)開車26年國產(chǎn)芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會以軟件彌補硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就
文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問詢之后,英偉達的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI
文/二風(fēng)來源/節(jié)點財經(jīng)一場關(guān)于“中國芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請。作為中國半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達背景、高達80億元人民幣的募資雄心,以及在國產(chǎn)GPU領(lǐng)域取
技術(shù)的進步永無止境,繼創(chuàng)下TPC-C性能&性價比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫再度實現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar
2025年9月24日,在杭州舉辦的云棲大會上,阿里云正式發(fā)布全新一代服務(wù)器操作系統(tǒng)AlibabaCloudLinux4(簡稱Alinux4)。Alinux4基于Linux6.6內(nèi)核打造,是首個全面遵循龍蜥社區(qū)“開源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開源社區(qū)生態(tài),更針對阿里云最新9代ECS
9月24日,杭州云棲大會技術(shù)主論壇上,阿里云重磅發(fā)布AI安全護欄,提供五項核心安全能力,護航AI安全。一方面為客戶提供融入AIAgent開發(fā)全鏈路的原生安全防護,另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級,打造Agentic-SOC安全運營,提升安全威脅檢測和響應(yīng)效率。在過去的一年,AIAgent正在