文 | 智能相對(duì)論
作者 | 陳泊丞
日前,英偉達(dá)CEO黃仁勛和Meta創(chuàng)始人馬克?扎克伯格開展了一場(chǎng)“爐邊談話”。
兩人作為當(dāng)今人工智能領(lǐng)域的領(lǐng)袖人物,一邊憑借AI芯片的絕對(duì)優(yōu)勢(shì)占據(jù)著算力領(lǐng)域的至高地位,另一邊借助開源大模型Llama 3.1強(qiáng)勢(shì)崛起成為開源領(lǐng)域的標(biāo)桿。這樣的對(duì)話為未來AI的發(fā)展趨勢(shì)呈現(xiàn)了不同的視角。
黃仁勛對(duì)話扎克伯格
兩位大咖的對(duì)話為我們描繪了AI技術(shù)未來的發(fā)展藍(lán)圖:從開源的AI算法,到先進(jìn)的人形機(jī)器人,到未來即將普及的智能眼鏡,AI技術(shù)發(fā)展充滿了機(jī)遇與挑戰(zhàn)。未來AI手機(jī)、AIPC、AI汽車、智能眼鏡、服務(wù)器等等各類產(chǎn)品都會(huì)實(shí)現(xiàn)智能化升級(jí),復(fù)雜的模型、海量的數(shù)據(jù)和計(jì)算,都極大地依賴于AI算力支持。
AI算力也正在從專用計(jì)算擴(kuò)展到所有的計(jì)算場(chǎng)景,逐步形成“一切計(jì)算皆AI”的格局。
事實(shí)上,算力廠商們的動(dòng)作也見證了市場(chǎng)對(duì)算力發(fā)展的要求。一方面,CPU、GPU、NPU等各種PU,也都被用于了AI計(jì)算。
另一方面,在適配不同場(chǎng)景應(yīng)用的通用服務(wù)器上,浪潮信息也在致力于提供兼具高性能與低成本的選擇。前不久,基于2U4路旗艦通用服務(wù)器NF8260G7,浪潮信息創(chuàng)新采用領(lǐng)先的張量并行、NF4模型量化等技術(shù),實(shí)現(xiàn)了服務(wù)器僅依靠4顆CPU即可運(yùn)行千億參數(shù)“源2.0”大模型,再度成為通用AI算力的新標(biāo)桿。
在今天的市場(chǎng)上,算力的產(chǎn)業(yè)地位正在迅速崛起。對(duì)應(yīng)人工智能發(fā)展的三駕馬車,算力、算法、數(shù)據(jù)三者終于到達(dá)了一個(gè)地位相當(dāng)?shù)臓顟B(tài),走向“并駕齊驅(qū)”。
要知道,在AI技術(shù)發(fā)展的前期,中國(guó)龐大的互聯(lián)網(wǎng)用戶群體和豐富的在線數(shù)據(jù)資源,側(cè)重于數(shù)據(jù)的發(fā)展。而美國(guó)在計(jì)算機(jī)科學(xué)、數(shù)學(xué)和統(tǒng)計(jì)學(xué)等基礎(chǔ)學(xué)科方面有著悠久的研究傳統(tǒng),則更聚焦算法的研發(fā)。對(duì)比兩者,算力在前期的關(guān)注度就顯得弱了許多。
時(shí)至今日,三駕馬車并駕齊驅(qū)。大眾對(duì)人工智能的發(fā)展思路也愈發(fā)清晰——AI產(chǎn)業(yè)的爆發(fā)是算法、算力與數(shù)據(jù)三者協(xié)同發(fā)展的結(jié)果。而這樣的狀態(tài)也就代表著AI產(chǎn)業(yè)正在進(jìn)入一個(gè)全新的階段。
人工智能產(chǎn)業(yè) 來到了“過彎點(diǎn)”
現(xiàn)階段,大模型技術(shù)的加速迭代,帶來了千億級(jí)大模型的持續(xù)涌現(xiàn)與精進(jìn)。相關(guān)的AI應(yīng)用也在以前所未有的速度和規(guī)模滲透到各行各業(yè),并融入日常的生活和工作中。
人工智能產(chǎn)業(yè)正在從初步探索進(jìn)入到了廣泛應(yīng)用的“過彎點(diǎn)”。在這個(gè)過程中,AI的三駕馬車也到了全面協(xié)同發(fā)展的關(guān)鍵時(shí)刻,才能為場(chǎng)景應(yīng)用的跨越式升級(jí)提供必要的技術(shù)支持。
以銀行的防欺詐系統(tǒng)為例,早期的系統(tǒng)是基于大數(shù)據(jù)構(gòu)建的,通過經(jīng)驗(yàn)預(yù)設(shè)規(guī)則和統(tǒng)計(jì)模型來判斷、檢測(cè)可疑交易。如今,基于更高性能的通用算力整合大數(shù)據(jù)系統(tǒng)和金融防詐的AI模型,銀行防欺詐系統(tǒng)實(shí)現(xiàn)了功能升級(jí),不僅具備更高的準(zhǔn)確性和更低的誤報(bào)率,而且還能夠根據(jù)新的數(shù)據(jù)自我學(xué)習(xí)和調(diào)整,快速適應(yīng)新的欺詐模式。
算法、算力和數(shù)據(jù)三者協(xié)同,構(gòu)成當(dāng)前AI應(yīng)用的基本范式。一個(gè)成功的AI項(xiàng)目往往需要在這三個(gè)方面都做出適當(dāng)?shù)耐度牒蛢?yōu)化。
算法相當(dāng)于AI的大腦,負(fù)責(zé)處理信息、學(xué)習(xí)知識(shí)、做出決策。而數(shù)據(jù)是算法的基礎(chǔ),如果沒有足夠的數(shù)據(jù),即使是再先進(jìn)的算法也無法發(fā)揮出應(yīng)有的效果。
而在此基礎(chǔ)上,不管是算法的運(yùn)行還是數(shù)據(jù)的處理,都離不開算力的支持。特別是在涉及到大量的數(shù)據(jù)處理、復(fù)雜的模型訓(xùn)練以及實(shí)時(shí)的推理需求等場(chǎng)景中,AI對(duì)算力的要求,同時(shí)隨著場(chǎng)景的規(guī)?;占埃€得進(jìn)一步兼顧經(jīng)濟(jì)性。
現(xiàn)如今,針對(duì)AI產(chǎn)業(yè)的三駕馬車,算法、算力和數(shù)據(jù)層面的升級(jí)依舊在同步進(jìn)行,三者之間的協(xié)同在AI行業(yè)發(fā)展的驅(qū)動(dòng)下達(dá)到了新高度。AI產(chǎn)業(yè)的加速發(fā)展,需要三駕馬車的步伐更加一致。
是時(shí)候全面調(diào)整 三駕馬車的狀態(tài)了
人工智能的廣泛應(yīng)用必然要建立在三駕馬車協(xié)同發(fā)展的基礎(chǔ)上。在接下來的時(shí)間內(nèi),針對(duì)人工智能產(chǎn)業(yè)的升級(jí)就需要解決一個(gè)關(guān)鍵問題,即如何保持三駕馬車并駕齊驅(qū)的穩(wěn)定狀態(tài)。
一、技術(shù)“并駕”:一馬當(dāng)先并非最佳,三馬同行最為穩(wěn)定。
算力、算法、數(shù)據(jù)三者相輔相成,單一的技術(shù)領(lǐng)先無法帶來AI產(chǎn)業(yè)的全面爆發(fā),必須要另外兩項(xiàng)迅速補(bǔ)齊,才能對(duì)應(yīng)解決相關(guān)的技術(shù)問題。
例如,在當(dāng)前,千億級(jí)參數(shù)、甚至萬億級(jí)參數(shù)的大模型加速發(fā)展,帶來了更強(qiáng)大的信息處理和決策能力,為智能涌現(xiàn)提供了基礎(chǔ)。但是,算法層面的突破,必然要有算力、數(shù)據(jù)層面的升級(jí),才能發(fā)揮出應(yīng)用的效果。簡(jiǎn)單來說,如果沒有足夠的算力帶動(dòng)千億級(jí)大模型的訓(xùn)練、推理等需求,那么再?gòu)?qiáng)大的模型也沒有“用武之地”。
要加速人工智能的發(fā)展,支撐千行百業(yè)最廣泛的通用場(chǎng)景,千億級(jí)大模型必須要和大數(shù)據(jù)、數(shù)據(jù)庫(kù)、云等場(chǎng)景相融合,實(shí)現(xiàn)高效運(yùn)行。
但這一目標(biāo)對(duì)計(jì)算、內(nèi)存、通信等硬件資源需求量非常大。為了滿足更多用戶的AI算力需求,算力廠商不得不考慮如何有針對(duì)性地去克服現(xiàn)有的算力瓶頸。以承載千億參數(shù)大模型推理的NF8260G7 AI通用服務(wù)器來看,浪潮信息在這方面就做出了專業(yè)的設(shè)計(jì)。
針對(duì)千億級(jí)大模型推理過程中的低時(shí)延以及所需的巨大內(nèi)存需求,NF8260G7服務(wù)器配置了4顆具有AMX的AI加速功能的英特爾至強(qiáng)處理器,內(nèi)存方面,NF8260G7配置32根32G DDR5 4800MHZ的內(nèi)存,內(nèi)存帶寬實(shí)測(cè)值分別為995GB/s(讀帶寬)、423GB/s(寫帶寬)、437GB/s(讀寫帶寬),為滿足千億大模型低延時(shí)和多處理器的并發(fā)推理計(jì)算打下基礎(chǔ)。同時(shí),浪潮信息還對(duì)CPU之間、CPU與內(nèi)存之間的高速互聯(lián)信號(hào)走線路徑和阻抗連續(xù)性做了優(yōu)化,從而更好地支撐大規(guī)模并發(fā)計(jì)算。
這樣的設(shè)計(jì)與升級(jí),旨在面向算法,進(jìn)行算力的優(yōu)化,為接下來千億級(jí)大模型的規(guī)?;瘧?yīng)用提供了一個(gè)非常關(guān)鍵的支撐。
二、系統(tǒng)“齊驅(qū)”:三馬拉車,重在系統(tǒng)性優(yōu)化。
隨著AI技術(shù)的發(fā)展,算力、算法、數(shù)據(jù)三者的系統(tǒng)性越來越強(qiáng)。很多科技巨頭都在競(jìng)相發(fā)力尋找「模型水平高、算力門檻低」的人工智能方案。AI相關(guān)的解決方案不再是單一技術(shù)的應(yīng)用,而是綜合多個(gè)領(lǐng)域的突破實(shí)現(xiàn)整體系統(tǒng)性的升級(jí)。
舉個(gè)例子,谷歌的EfficientNet模型通過優(yōu)化網(wǎng)絡(luò)架構(gòu),在ImageNet數(shù)據(jù)集上的精度相比傳統(tǒng)模型提升了約6%,而所需計(jì)算量減少了70%。可見,當(dāng)前大模型廠商在推動(dòng)算力升級(jí)的過程中,也會(huì)考慮到軟件層面的創(chuàng)新,提高算力和算法之間的適配運(yùn)行能力。
為了能讓通用服務(wù)器更好的運(yùn)行千億級(jí)大模型,浪潮信息除了對(duì)服務(wù)器本身進(jìn)行創(chuàng)新升級(jí)外,也對(duì)千億級(jí)大模型的參數(shù)規(guī)模做了優(yōu)化?;谠?.0的算法研發(fā)積累,浪潮信息將1026億參數(shù)的源2.0大模型卷積算子進(jìn)行張量切分,為通用服務(wù)器進(jìn)行高效的張量并行計(jì)算提供了可能,最終提高了推理計(jì)算效率。
基于CPU服務(wù)器的并行計(jì)算
同時(shí),在這個(gè)過程中,浪潮信息還采用了NF4量化技術(shù),對(duì)模型進(jìn)行“瘦身”,提高了推理的解碼效率等等。
NF4量化技術(shù)
當(dāng)算力、算法走向協(xié)同,系統(tǒng)性優(yōu)化的結(jié)果,是建立在兩者協(xié)同的基礎(chǔ)之上,最終目的在于為AI產(chǎn)業(yè)的落地提供一個(gè)穩(wěn)定、強(qiáng)大的技術(shù)底座。未來,AI產(chǎn)業(yè)的全面爆發(fā)就需要以更系統(tǒng)的理念去驅(qū)動(dòng)三駕馬車的發(fā)展。
三、應(yīng)用“加速”:產(chǎn)業(yè)落地需要“三駕馬車”的綜合最優(yōu)解。
AI不再是實(shí)驗(yàn)室的產(chǎn)物,而是市場(chǎng)競(jìng)爭(zhēng)的商品。不管是千億級(jí)大模型的涌現(xiàn),或是算力解決方案的升級(jí),其根本的目標(biāo)都是推動(dòng)AI應(yīng)用的加速落地,走向大眾,帶來實(shí)際性的經(jīng)濟(jì)效益。因此,在技術(shù)層面之外,行業(yè)還需要考慮經(jīng)濟(jì)層面的問題。
對(duì)比來看,盡管以英偉達(dá)GPU芯片為核心的AI服務(wù)器在處理機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等高性能計(jì)算任務(wù)方面表現(xiàn)卓越,但是浪潮信息等算力廠商依舊致力于研發(fā)和升級(jí)以CPU為核心的通用服務(wù)器,這是為什么?
根本原因就在于CPU在通用計(jì)算、能效比以及成本效益方面仍然不可替代。特別是關(guān)系成本效益的經(jīng)濟(jì)性問題,本來就是當(dāng)前限制諸多場(chǎng)景應(yīng)用規(guī)模化落地發(fā)展的關(guān)鍵因素。因?yàn)锳I專用基礎(chǔ)設(shè)施的成本居高不下,普通的企業(yè)很難承受。而浪潮信息則是提供了一個(gè)更低成本、同時(shí)兼顧高性能的經(jīng)濟(jì)性選擇,恰恰正是市場(chǎng)需要的。
基于通用服務(wù)器NF8260G7的軟硬件協(xié)同創(chuàng)新,浪潮信息成功實(shí)現(xiàn)了千億級(jí)大模型在通用服務(wù)器的推理部署,同時(shí)還提供了性能更強(qiáng),成本更經(jīng)濟(jì)的選擇,讓AI大模型應(yīng)用可以與云、大數(shù)據(jù)、數(shù)據(jù)庫(kù)等應(yīng)用能夠?qū)崿F(xiàn)更緊密的融合,助力產(chǎn)業(yè)高質(zhì)量發(fā)展。這樣的綜合最優(yōu)解,才是產(chǎn)業(yè)實(shí)現(xiàn)規(guī)?;l(fā)最需要的條件。
結(jié)語(yǔ)
AI三駕馬車的系統(tǒng)性已經(jīng)成型,更強(qiáng)大的算力可以支持更復(fù)雜的算法模型,從而更好地處理大規(guī)模數(shù)據(jù)。同時(shí),高質(zhì)量的數(shù)據(jù)集有助于提升算法的效果,反過來又需要更強(qiáng)大的算力來處理。而算法的進(jìn)步也可以減少對(duì)算力的需求,通過更高效的模型設(shè)計(jì)降低計(jì)算成本。
這種系統(tǒng)性的形成,將極大推動(dòng)人工智能產(chǎn)業(yè)的發(fā)展,也為現(xiàn)階段AI廠商們的產(chǎn)品升級(jí)、技術(shù)迭代、服務(wù)進(jìn)階提供了一個(gè)關(guān)鍵的大方向。但同時(shí),也意味著新的挑戰(zhàn),即如何去整合算力、算法和數(shù)據(jù)三者之間的技術(shù)與資源,成就新的突破。
*本文圖片均來源于網(wǎng)絡(luò)
#智能相對(duì)論 Focusing on智能新產(chǎn)業(yè)新服務(wù),這是智能的服務(wù)NO.263深度解讀
此內(nèi)容為【智能相對(duì)論】原創(chuàng),
僅代表個(gè)人觀點(diǎn),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。
部分圖片來自網(wǎng)絡(luò),且未核實(shí)版權(quán)歸屬,不作為商業(yè)用途,如有侵犯,請(qǐng)作者與我們聯(lián)系。
•AI產(chǎn)業(yè)新媒體;
•澎湃新聞科技榜單月度top5;
•文章長(zhǎng)期“霸占”鈦媒體熱門文章排行榜TOP10;
•著有《人工智能 十萬個(gè)為什么》
•【重點(diǎn)關(guān)注領(lǐng)域】智能家電(含白電、黑電、智能手機(jī)、無人機(jī)等AIoT設(shè)備)、智能駕駛、AI+醫(yī)療、機(jī)器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計(jì)算、開發(fā)者以及背后的芯片、算法等。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
在信息技術(shù)持續(xù)革新與市場(chǎng)競(jìng)爭(zhēng)日趨激烈的行業(yè)環(huán)境下,本地生活服務(wù)領(lǐng)域正經(jīng)歷著深刻的智能化轉(zhuǎn)型。這一轉(zhuǎn)型過程不僅涉及技術(shù)層面的升級(jí)迭代,更關(guān)乎服務(wù)模式與行業(yè)生態(tài)的系統(tǒng)性重構(gòu)。閱北科技通過持續(xù)推進(jìn)算法技術(shù)的優(yōu)化與應(yīng)用,在提升服務(wù)精準(zhǔn)度和用戶滿意度方面進(jìn)行了積極探索。閱北的算法系統(tǒng)建立在持續(xù)優(yōu)化的技術(shù)架構(gòu)之
2025年10月17日,上海在人工智能技術(shù)加速演進(jìn)、產(chǎn)業(yè)生態(tài)持續(xù)升級(jí)的關(guān)鍵時(shí)期,由上海市漕河涇新興技術(shù)開發(fā)區(qū)發(fā)展總公司聯(lián)合天罡智算交易平臺(tái)共同發(fā)起成立的“漕河涇天罡人工智能研究院”(以下簡(jiǎn)稱“研究院”)正式揭牌。研究院將依托漕河涇的產(chǎn)業(yè)資源與平臺(tái)優(yōu)勢(shì),聯(lián)合上海交通大學(xué)、上海社會(huì)科學(xué)院等權(quán)威機(jī)構(gòu),聚焦
以“智能時(shí)代同球共濟(jì)”為主題的2025世界人工智能大會(huì)在上海正式開幕。
“AI大模型六小虎”百川智能危機(jī)重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學(xué)習(xí)科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的
人工智能作為引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù),正在加速融入千行百業(yè),便利千家萬戶。
在數(shù)字化與智能化深度交織的時(shí)代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動(dòng)Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會(huì)在北京盛大召開。來自國(guó)家部委、院士學(xué)者、高校科研機(jī)構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)
2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國(guó)際院士科創(chuàng)中心主辦,中國(guó)投資協(xié)會(huì)能源投資專業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國(guó)電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,
我覺得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級(jí)AI體系。所以這是俺對(duì)未來5年中國(guó)AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國(guó)產(chǎn)開車26年國(guó)產(chǎn)芯片會(huì)在推理和垂直場(chǎng)景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會(huì)以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就
文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國(guó)科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI
文/二風(fēng)來源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)關(guān)于“中國(guó)芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會(huì)已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請(qǐng)。作為中國(guó)半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心,以及在國(guó)產(chǎn)GPU領(lǐng)域取
技術(shù)的進(jìn)步永無止境,繼創(chuàng)下TPC-C性能&性價(jià)比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫(kù)再度實(shí)現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會(huì)上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫(kù)專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar
2025年9月24日,在杭州舉辦的云棲大會(huì)上,阿里云正式發(fā)布全新一代服務(wù)器操作系統(tǒng)AlibabaCloudLinux4(簡(jiǎn)稱Alinux4)。Alinux4基于Linux6.6內(nèi)核打造,是首個(gè)全面遵循龍蜥社區(qū)“開源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開源社區(qū)生態(tài),更針對(duì)阿里云最新9代ECS
9月24日,杭州云棲大會(huì)技術(shù)主論壇上,阿里云重磅發(fā)布AI安全護(hù)欄,提供五項(xiàng)核心安全能力,護(hù)航AI安全。一方面為客戶提供融入AIAgent開發(fā)全鏈路的原生安全防護(hù),另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級(jí),打造Agentic-SOC安全運(yùn)營(yíng),提升安全威脅檢測(cè)和響應(yīng)效率。在過去的一年,AIAgent正在