文 | 智能相對(duì)論
作者 | 沈浪
知名科學(xué)雜志《Nature》發(fā)表了一篇關(guān)于大模型規(guī)模參數(shù)大小爭(zhēng)議的文章《In Al, is bigger always better?》——AI大模型,越大越好嗎?隨著大模型應(yīng)用走向?qū)嵺`,這一問(wèn)題不可避免地成為了當(dāng)前AI行業(yè)發(fā)展的焦點(diǎn)與爭(zhēng)議。
有人認(rèn)為,大模型當(dāng)然是越大越好,參數(shù)越大,性能越優(yōu)。也有人認(rèn)為,小模型更好,消耗更小,更能精準(zhǔn)地解決專業(yè)問(wèn)題。兩相對(duì)比之下,各有各的道理,懸而未決,究竟什么才是AI大模型發(fā)展的出路?
這一問(wèn)題或許在日前商湯科技舉辦的技術(shù)交流日活動(dòng)上有所解答。在活動(dòng)現(xiàn)場(chǎng),商湯科技發(fā)布了行業(yè)首個(gè)“云、端、邊”全棧大模型產(chǎn)品矩陣,以滿足不同規(guī)模場(chǎng)景的應(yīng)用需求,對(duì)大模型的場(chǎng)景應(yīng)用提出了新的思路,并且全新升級(jí)了“日日新SenseNova 5.0”大模型體系,綜合能力全面對(duì)標(biāo)GPT-4 Turbo。
當(dāng)然,在當(dāng)前節(jié)點(diǎn)上,領(lǐng)先的意義已經(jīng)不僅僅是超越GPT-4,更是探索出能解決實(shí)際應(yīng)用問(wèn)題的有效路徑。
01、離譜or靠譜?日日新端側(cè)大模型“暴打”GPT-4
在技術(shù)交流日活動(dòng)的現(xiàn)場(chǎng),商湯科技以一個(gè)很有趣的畫(huà)面闡釋了大模型與小模型之間的差別。基于拳皇游戲的畫(huà)面演示,商湯科技將自家的SenseChat-Lite 版本日日新端側(cè)?模型與GPT-4進(jìn)行PK。
一開(kāi)始,GPT-4還能略占上風(fēng),但是SenseChat-Lite出拳速度更快,隨后各種連招打到他根本反應(yīng)不過(guò)來(lái),只得被商湯科技的模型“暴打”,直接K.O出局。
這一結(jié)局似乎太離譜了?商湯科技對(duì)此做了解釋:實(shí)際上其中的差距并非模型能力強(qiáng)弱問(wèn)題,而是在不同的適用場(chǎng)景之下小模型決策速度快。當(dāng)大模型還在計(jì)算的時(shí)候,小模型已經(jīng)完成了判斷并且出拳了,而且實(shí)實(shí)在在打到了對(duì)手身上。
正所謂,“天下武功,唯快不破”!對(duì)比大模型,小模型在具體的場(chǎng)景應(yīng)用中有著更明顯的決策優(yōu)勢(shì)。
因此,業(yè)內(nèi)正在形成一個(gè)全面的共識(shí):在實(shí)際應(yīng)用中,大模型并非越大越好,而是得看具體場(chǎng)景需求。前不久,美國(guó)AI公司Anthropic發(fā)布Claude 3系列模型,一度超越GPT-4,登頂全球最強(qiáng)大模型。其中Claude 3系列就給出了不同量級(jí)的模型產(chǎn)品,包括Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,以便適用于不同的企業(yè)和場(chǎng)景。
同樣的,基于這一思路,商湯科技也在搭建完善的基模型體系與小模型系統(tǒng)方案,并發(fā)布了一系列的垂類大模型和端側(cè)大模型。其中,SenseChat-Lite版本端側(cè)大模型就可以面向手機(jī)、平板、VR 眼鏡、智能汽車等提供輕量、高效的大模型能力,結(jié)合端云解決方案,及時(shí)適應(yīng)變化的環(huán)境和需求,保持高性能和準(zhǔn)確性。
對(duì)比來(lái)說(shuō),中國(guó)更注重實(shí)踐。商湯科技在這個(gè)思路上給出的解決方案更具有主動(dòng)性和服務(wù)意識(shí)以及更有實(shí)踐價(jià)值。具體的,商湯端側(cè)大模型不僅是參數(shù)量級(jí)小,還講究端側(cè)部署與端側(cè)處理能力的強(qiáng)化,在解決實(shí)際問(wèn)題上響應(yīng)更快速。
與此同時(shí),商湯科技還面向金融、代碼、醫(yī)療、政務(wù)等多個(gè)領(lǐng)域推出了邊緣產(chǎn)品“商湯企業(yè)級(jí)大模型一體機(jī)”,在實(shí)際場(chǎng)景應(yīng)用中更能滿足專業(yè)化需求,主動(dòng)貼合客戶需求。比如,“大醫(yī)”醫(yī)療健康大模型一體機(jī)就可以在醫(yī)療機(jī)構(gòu)內(nèi)部一鍵部署大模型應(yīng)用,實(shí)現(xiàn)“開(kāi)箱即用”,并有效針對(duì)智能問(wèn)診、導(dǎo)診、病歷結(jié)構(gòu)化、影像報(bào)告解讀等場(chǎng)景,支持智能調(diào)整回復(fù)內(nèi)容的語(yǔ)言風(fēng)格、詳略程度、格式要求等。
當(dāng)然,這也是目前商湯科技在AI大模型領(lǐng)域領(lǐng)先行業(yè)的關(guān)鍵點(diǎn)。同樣的思路,以小模型為應(yīng)用焦點(diǎn),商湯比別人多走了幾步,提出了軟硬兼顧的解決方案。
02、在尺度定律之下,沒(méi)有永恒的“最強(qiáng)”,唯有“日日新”
從經(jīng)濟(jì)性而言,小模型更利于企業(yè)應(yīng)用與解決實(shí)際問(wèn)題。那么,是否對(duì)于AI行業(yè)而言,就不需要訓(xùn)練大模型了?
實(shí)則不然。
在技術(shù)交流日活動(dòng)現(xiàn)場(chǎng),商湯科技提到了一個(gè)同為業(yè)內(nèi)共識(shí)的理論:尺度定律。在普遍的認(rèn)知中,以尺度定律為參考,隨著模型的參數(shù)變大、數(shù)據(jù)量變大、訓(xùn)練時(shí)長(zhǎng)加長(zhǎng),則算法性能會(huì)越來(lái)越好。
OpenAl于2020年曾發(fā)布一篇論文《Scaling Laws for Neural Language Models》,其中也有類似的觀點(diǎn),即模型性能隨著模型參數(shù)大小的增長(zhǎng)而變好。因此,在后續(xù)的大模型迭代中,OpenAI通過(guò)構(gòu)建一個(gè)巨大的海量數(shù)據(jù)集,再簡(jiǎn)單增加GPT模型的深度,就做出了具有驚人的涌現(xiàn)能力的大模型產(chǎn)品。
對(duì)此,很多廠商也作了相關(guān)驗(yàn)證,包括谷歌、商湯科技等。其中,谷歌曾精調(diào)了三個(gè)尺寸的Minerva模型,分別使用了80億,620億和5400億個(gè)參數(shù)的預(yù)訓(xùn)練PaLM模型。
結(jié)果發(fā)現(xiàn),Minerva的性能隨著規(guī)模的擴(kuò)大而提高。在整個(gè)MATH數(shù)據(jù)集上,最小模型的準(zhǔn)確率為25%,中型模型達(dá)到43%,最大模型突破50%大關(guān)。
由此,基于尺度定律的認(rèn)知,他們發(fā)現(xiàn)自家的模型產(chǎn)品在一定測(cè)試級(jí)上超越GPT-4的能力,并非不可能。如今,商湯科技發(fā)布的最新的“日日新SenseNova 5.0”大模型體系,其性能就超越了GPT-4。
其中,日日新·商量大模型5.0主模型在語(yǔ)言、知識(shí)、推理、數(shù)學(xué)、代碼等領(lǐng)域的能力,在主流客觀評(píng)測(cè)上就達(dá)到或超越了GPT-4 Turbo,在聊天、多輪對(duì)話、信息提取、寫(xiě)作等場(chǎng)景能和GPT-4 Turbo相媲美。
更值得一提的是,日日新·商量多模態(tài)大模型的圖文感知能力達(dá)到了全球領(lǐng)先水平,在多模態(tài)大模型權(quán)威綜合基準(zhǔn)測(cè)試MMBench中綜合得分排名首位,并在多個(gè)知名多模態(tài)榜單MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU 取得領(lǐng)先成績(jī)。
換句話說(shuō),在尺度定律的認(rèn)知下,GPT-4被超越是遲早的事情,AI大模型領(lǐng)域沒(méi)有永恒的“最強(qiáng)”。
當(dāng)然,若要登頂最強(qiáng),雖說(shuō)可行,但絕不簡(jiǎn)單。大模型的參數(shù)爭(zhēng)議,其中就有能耗的問(wèn)題。谷歌曾坦言,PaLM的訓(xùn)練在2個(gè)月內(nèi)消耗了大約300個(gè)美國(guó)家庭一年的電力消耗,其中所需要的算力、數(shù)據(jù)等基礎(chǔ)設(shè)施絕非常規(guī)企業(yè)可以負(fù)擔(dān)。
在這一點(diǎn)上,商湯科技秉持“大模型+大算力”的“雙輪驅(qū)動(dòng)”戰(zhàn)略布局又一次為其拓寬了道路。其中,SenseCore商湯大裝置作為商湯科技前瞻決策所打造的高效率、低成本、規(guī)?;男乱淮鶤I基礎(chǔ)設(shè)施,可以支撐超過(guò)20個(gè)千億超大模型同時(shí)訓(xùn)練,并支持萬(wàn)億參數(shù)大模型的全生命周期生成,為大模型的打造提供了非常關(guān)鍵的支撐。
簡(jiǎn)單來(lái)說(shuō),雖說(shuō)有尺度定律作為理論支持,但是以SenseCore商湯大裝置為代表的大算力才是商湯科技能超越GPT-4的底氣。從這個(gè)角度來(lái)看,商湯科技做AI,比大多企業(yè)要更加純粹且徹底。
03、大模型的最優(yōu)解,是場(chǎng)景平衡
從國(guó)內(nèi)外的實(shí)驗(yàn)與實(shí)踐來(lái)看,模型的大小之爭(zhēng)意義不大,離開(kāi)基礎(chǔ)理論和場(chǎng)景應(yīng)用去拋棄任何一方都不可取。因此,目前主流的AI廠商在迭代和發(fā)布系列模型時(shí),往往都會(huì)推出主模型與小模型以及垂類專業(yè)模型,根據(jù)場(chǎng)景需求按需提供服務(wù)。
這一點(diǎn)將在接下來(lái)的時(shí)間里拉開(kāi)專業(yè)AI服務(wù)商之間的差距。目前,日日新SenseNova5.0大模型體系采用了混合專家模式,這樣做的目的在于通過(guò)將模型分割成多個(gè)具有專門(mén)功能的模塊,使得模型在推理過(guò)程中能更有效地利用計(jì)算資源,并可能提高模型的泛化能力和應(yīng)對(duì)復(fù)雜任務(wù)的性能。
具體來(lái)看,商湯瓊宇發(fā)布的3D高斯?jié)姙R技術(shù),就具備輕量化的web渲染能力,可以產(chǎn)生更輕量的模型資產(chǎn),使城市級(jí)三維模型的構(gòu)建和編輯重建效果更加真實(shí),成本更低,也可以應(yīng)用在更多場(chǎng)景。
這是混合專家模式思想在實(shí)際應(yīng)用中的體現(xiàn),通過(guò)不同技術(shù)和模型組件之間的配合,實(shí)現(xiàn)了對(duì)特定任務(wù)定制化處理和資源優(yōu)化,從而加速大模型在不同場(chǎng)景中的應(yīng)用,實(shí)現(xiàn)AI普惠。目前,瓊宇已服務(wù)客戶超過(guò)60個(gè),實(shí)現(xiàn)了15個(gè)城市120多種場(chǎng)景的重建。
因此,當(dāng)我們把目光投遞到實(shí)際中的場(chǎng)景問(wèn)題,就會(huì)發(fā)現(xiàn)大模型和小模型均有用武之地,問(wèn)題則在于如何去平衡地調(diào)配資源,實(shí)現(xiàn)最優(yōu)解。由此來(lái)看,商湯科技對(duì)混合專家模式的應(yīng)用,可以視為是一種領(lǐng)先行業(yè)的熟練決策。
未來(lái)不屬于大模型或小模型,而是大小模型之間的平衡。因此,“AI大模型是否越大越好”類似的問(wèn)題不必糾結(jié),但需要面對(duì),即如何去打造大模型,又如何把大模型的能力調(diào)配出小模型服務(wù)好市場(chǎng),會(huì)是各大廠商接下來(lái)的必修課程。
*本文圖片均來(lái)源于網(wǎng)絡(luò)
此內(nèi)容為【智能相對(duì)論】原創(chuàng),
僅代表個(gè)人觀點(diǎn),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。
部分圖片來(lái)自網(wǎng)絡(luò),且未核實(shí)版權(quán)歸屬,不作為商業(yè)用途,如有侵犯,請(qǐng)作者與我們聯(lián)系。
•AI產(chǎn)業(yè)新媒體;
•澎湃新聞科技榜單月度top5;
•文章長(zhǎng)期“霸占”鈦媒體熱門(mén)文章排行榜TOP10;
•著有《人工智能 十萬(wàn)個(gè)為什么》
•【重點(diǎn)關(guān)注領(lǐng)域】智能家電(含白電、黑電、智能手機(jī)、無(wú)人機(jī)等AIoT設(shè)備)、智能駕駛、AI+醫(yī)療、機(jī)器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計(jì)算、開(kāi)發(fā)者以及背后的芯片、算法等。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
9月24日,2025云棲大會(huì)在杭州開(kāi)幕,阿里巴巴集團(tuán)CEO、阿里云智能集團(tuán)董事長(zhǎng)兼CEO吳泳銘發(fā)表主旨演講,首次系統(tǒng)性地闡述通往ASI的三階段演進(jìn)路線,包括智能涌現(xiàn)、自主行動(dòng)以及自我迭代等,實(shí)現(xiàn)從學(xué)習(xí)人、輔助人到超越人的發(fā)展脈絡(luò)?;谏鲜龅陌l(fā)展路線,吳泳銘對(duì)外做出判斷,大模型是下一代的操作系統(tǒng)?!拔?/p>
文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)每年高考成績(jī)放榜后,數(shù)千萬(wàn)考生和家長(zhǎng)將迎來(lái)另一場(chǎng)硬仗——填報(bào)志愿。今年,這一領(lǐng)域迎來(lái)了AI的全面介入,多家互聯(lián)網(wǎng)大廠和教育公司紛紛推出智能志愿填報(bào)產(chǎn)品,為考生提供院校和專業(yè)選擇建議。據(jù)艾媒咨詢數(shù)據(jù),2023年中國(guó)高考志愿填報(bào)市場(chǎng)付費(fèi)規(guī)模約9.5億元,近九成考生愿意借助志愿填報(bào)服
崔大寶|節(jié)點(diǎn)財(cái)經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢(shì):資本市場(chǎng),與之關(guān)聯(lián)的概念炒不動(dòng)了,英偉達(dá)股價(jià)動(dòng)輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費(fèi)市場(chǎng),BATH們的推新活動(dòng)少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場(chǎng)酣仗:自5月15日字節(jié)跳動(dòng)宣布“以厘計(jì)費(fèi)”,打響國(guó)內(nèi)大模型
年初大模型行業(yè)上演“長(zhǎng)文本”大戰(zhàn)時(shí),我們就萌生過(guò)做一個(gè)“讀書(shū)助理”的想法。測(cè)試了市面上主流的大模型后,發(fā)現(xiàn)普遍存在兩個(gè)不足:一種是可以處理的文本長(zhǎng)度不夠,即使有些大模型將文本長(zhǎng)度提升到了20萬(wàn)字,像《紅樓夢(mèng)》這樣近百萬(wàn)字的名著,還是需要多次才能“讀”完。另一種是語(yǔ)言理解和生成能力不足,經(jīng)常出現(xiàn)“幻覺(jué)
互聯(lián)網(wǎng)或許從未停止創(chuàng)新,只是對(duì)于創(chuàng)新的認(rèn)知下降了。
在數(shù)字化與智能化深度交織的時(shí)代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動(dòng)Dynamic·數(shù)智躍遷博弈無(wú)界”為主題的2025TechWorld智慧安全大會(huì)在北京盛大召開(kāi)。來(lái)自國(guó)家部委、院士學(xué)者、高??蒲袡C(jī)構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)
2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國(guó)際院士科創(chuàng)中心主辦,中國(guó)投資協(xié)會(huì)能源投資專業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國(guó)電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,
我覺(jué)得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開(kāi)發(fā),建立可控的世界級(jí)AI體系。所以這是俺對(duì)未來(lái)5年中國(guó)AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國(guó)產(chǎn)開(kāi)車26年國(guó)產(chǎn)芯片會(huì)在推理和垂直場(chǎng)景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會(huì)以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開(kāi),訓(xùn)練就
文/道哥在深陷“后門(mén)”風(fēng)波、接受網(wǎng)信辦問(wèn)詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國(guó)科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI
文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)關(guān)于“中國(guó)芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會(huì)已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請(qǐng)。作為中國(guó)半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心,以及在國(guó)產(chǎn)GPU領(lǐng)域取
技術(shù)的進(jìn)步永無(wú)止境,繼創(chuàng)下TPC-C性能&性價(jià)比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫(kù)再度實(shí)現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會(huì)上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫(kù)專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar
2025年9月24日,在杭州舉辦的云棲大會(huì)上,阿里云正式發(fā)布全新一代服務(wù)器操作系統(tǒng)AlibabaCloudLinux4(簡(jiǎn)稱Alinux4)。Alinux4基于Linux6.6內(nèi)核打造,是首個(gè)全面遵循龍蜥社區(qū)“開(kāi)源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開(kāi)源社區(qū)生態(tài),更針對(duì)阿里云最新9代ECS
9月24日,杭州云棲大會(huì)技術(shù)主論壇上,阿里云重磅發(fā)布AI安全護(hù)欄,提供五項(xiàng)核心安全能力,護(hù)航AI安全。一方面為客戶提供融入AIAgent開(kāi)發(fā)全鏈路的原生安全防護(hù),另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級(jí),打造Agentic-SOC安全運(yùn)營(yíng),提升安全威脅檢測(cè)和響應(yīng)效率。在過(guò)去的一年,AIAgent正在