當前位置:首頁 >  IDC >  云計算 >  正文

青云科技以多元算力調度管理AI基礎設施,以開放生態(tài)整合AI能力

 2023-09-26 16:38  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領券再下單

AI引發(fā)的算力需求到底有多大?各種預測數(shù)據(jù)雖然并不統(tǒng)一,但可以肯定的是AI和大模型又將帶來新一輪的生產力的變革,在這個技術催生的市場變化中,企業(yè)的應用變得更加復雜,業(yè)態(tài)會更加豐富,底層架構單一的CPU或者GPU已經(jīng)不能滿足需求。總而言之,企業(yè)面臨的技術和平臺挑戰(zhàn)將是空前的。

青云科技(qingcloud.com)總裁林源分析說:“從算力建設的角度去看,現(xiàn)在是算力集中建設的階段。大量的算力中心如雨后春筍般出來,成本和技術是最大的挑戰(zhàn)。如果說建設期就是蓋機房、購買設備,那么中長期的運營則是更專業(yè)、更復雜的問題。這些問題都需要解決,青云也給出了自己的答案,這就是青云最新推出的AI算力調度平臺。”

多元算力調度,管理AI基礎設施

“在近兩年運營過程中,我們總結出一些這個行業(yè)當前面臨的挑戰(zhàn),同時它也是青云所需要解決的問題。”青云科技產品經(jīng)理苗慧在分析行業(yè)挑戰(zhàn)的同時,也給出了青云科技的解決方案。

首先,解決行業(yè)多元資源統(tǒng)一調度管理的問題。

在AIGC領域,行業(yè)面臨的普遍問題是大文本和大量行業(yè)數(shù)據(jù)加速,不同的資源需要統(tǒng)一平臺進行管理。比如,一個影視渲染行業(yè)的用戶,需要渲染一部大電影,他們可以通過青云的平臺進行分發(fā),即時構建環(huán)境調度需要用到的渲染資源。

在AI訓練方面,用戶通過開源的人類自然語言模型訓練圖片、數(shù)據(jù),做模型微調,再加上自己的行業(yè)知識,也能通過青云統(tǒng)一的多源資源調度管理平臺進行分發(fā)管理。

對于管理員來說,通過青云的平臺,只要通過一個管理界面、一個大屏,就能看到其分布在全國的2000臺資源,3000個存儲節(jié)點等等,以最少的人力大大提升管理運維效率。

二、解決AI應用的網(wǎng)絡瓶頸。青云通過多種方式來解決網(wǎng)絡瓶頸的問題。在高速組網(wǎng)方面,青云基于傳統(tǒng)的云計算領域,增加了高速網(wǎng)絡,并針對不同種類和型號的網(wǎng)卡做了網(wǎng)卡虛擬化和完全的子網(wǎng)隔離,以確保用戶無論是按卡申請還是按節(jié)點申請,都能保證數(shù)據(jù)的安全隔離,保證用戶之間不存在這種數(shù)據(jù)的風險。

在通信鏈路方面,這也是青云在AI算力調度平臺著力最多的地方。青云將所有的節(jié)點、服務器、存儲設備都做出了路徑標簽,設置最佳路徑距離。通過算法,投入調度最短鏈路,計算最短鏈路,保證最好是兩個節(jié)點在一個交換機內,這樣不跨交換機,又減少一些數(shù)據(jù)的傳輸損耗。

針對AI訓練,青云提供了在線訓練平臺。把高性能計算、GPU卡等匯集成起來,在專屬的環(huán)境上,提供GPU服務器在線申請構建集群,所有的網(wǎng)絡和環(huán)境都可一鍵生成。并且青云會根據(jù)行業(yè)內常用的模型和小工具,進行集成。同時,青云在每個區(qū)域都有一個小型的容器鏡像中心,與鏡像節(jié)點和推理服務進行內網(wǎng)連接,這使得訓練過程更快,遠比在公網(wǎng)上拉數(shù)據(jù)等要快得多。

第三,解決環(huán)境搭建的復雜性問題。算力中心面向眾多的終端用戶,這就注定了它的復雜性。在環(huán)境搭建方面,青云有兩種方式為客戶提供常用的鏡像或者容器。

第四,解決多業(yè)務整合的瓶頸問題。青云目前已將更多的業(yè)務以松耦合的模式嵌入整合到青云云平臺。

第五,解決運維平臺的復雜管理問題。青云提供了更多的運營服務,尤其是算力中心服務。以國家超算濟南中心為例,其后端團隊,既要運維軟件還要負責客戶的各類運維問題,這就需要投入大量的人力還耗時耗力。青云通過一套運維平臺,讓其定價、打折、促銷等,只需要在頁面上點擊按鈕就可實現(xiàn),而不再需要通過申請表的傳統(tǒng)方式實現(xiàn)。

總結而言,青云AI算力調度平臺的特性主要有:第一,基于多種芯片,包括通用CPU、英偉達GPU、信創(chuàng)芯片等等;第二,全生命周期的管理;第三,AIGC業(yè)務化;第四,通過業(yè)務化、自動化,讓非計算機行業(yè)用戶能一鍵運行數(shù)據(jù)、業(yè)務和模型等。

開放的生態(tài)圈,實現(xiàn)AI整體能力的整合

青云AI算力調度平臺是算力中心運營者的關鍵工具,目前其服務的對象主要為現(xiàn)在和未來投入算力中心建設的企業(yè)——現(xiàn)在的投資者和未來的運營者。

青云把多年運營服務的經(jīng)驗融入到了產品、服務體系,并在國家超算濟南中心有了成功實踐。國家超算濟南中心是一個包括HPC超算、傳統(tǒng)云計算(以CPU為主)、智算(兼有國外及國產GPU)的多元計算中心。和眾多算力中心一樣,國家超算濟南中心需要的是滿足客戶需求的、成熟的運營工具和平臺。平臺能力越強,能支撐客戶的業(yè)務種類越多,客戶越多,盈利模式越清晰。

青云認為未來 AI 時代,企業(yè)一定是通過算力服務、算法和模型、高價值的數(shù)據(jù)來實現(xiàn)智能化,這也是 AI 生態(tài)體系的價值所在。青云也清醒地認識到與不同領域的合作伙伴一起實現(xiàn)整體能力的整合,才能夠更好地幫助企業(yè)實現(xiàn) AI 真正的業(yè)務價值。

干自己最擅長的AI算力資源調度,這也與青云科技十幾年來耕耘的云調度平臺、IaaS一脈相承。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
云服務

相關文章

  • raksmart洛杉磯云服務器全面解析

    RAKsmart洛杉磯云服務器是一種高性能的云計算解決方案,專為滿足不同業(yè)務需求而設計。以下是對RAKsmart洛杉磯云服務器的具體介紹,rak小編為您整理發(fā)布raksmart洛杉磯云服務器全面解析。

    標簽:
    云服務
  • 容器云服務價格高嗎?容器云服務價格表一覽

    一般來說,其價格并不是特別高。容器云服務的費用價格高低取決于多種因素,包括服務提供商、所選服務的類型、資源配置、地理位置等。對于服務器租用和托管而言,價格同樣會受到配置、帶寬、機房位置等因素的影響。

    標簽:
    云服務
  • 打造工業(yè)4.0的5G+邊緣云服務產業(yè)生態(tài),艾靈完成1.5億元A輪融資

    近日,艾靈完成1.5億元A輪融資。本輪投資方包括英特爾資本、深圳天使母基金直投基金、TCL中新融創(chuàng)、浦耀信曄、住友商事亞洲資本、新電投資(SingtelInnov8)、華迪創(chuàng)投。據(jù)透露,艾靈本輪融資將用于深化工業(yè)5G、工業(yè)智能等核心產品的研發(fā),加速在更多行業(yè)落地推廣,推動重要行業(yè)市場大規(guī)模商用落地,

    標簽:
    云服務
    5g技術
  • 點贊+1 !青云QingCloud收到中國市政中南院的感謝信

    青云科技(qingcloud.com)收到中國市政工程中南設計研究總院有限公司(簡稱:中國市政中南院)智慧城市研究院的感謝信,信中向青云團隊卓越的技術和專業(yè)服務表達謝意。中國市政中南院主動響應“數(shù)字中國”戰(zhàn)略,順應宜居、智慧、韌性城市發(fā)展趨勢,整合全院數(shù)字化資源成立了智慧城市研究院,專門推動數(shù)字化轉

    標簽:
    云服務
  • 群擎并舉,眾芯共魂,龍蜥立于云智融合潮頭聚力共筑產業(yè)未來

    今日,由開放原子開源基金會指導,龍蜥社區(qū)主辦,阿里云、浪潮信息、Arm、Intel、中興通訊、統(tǒng)信軟件等24家理事單位共同承辦的,主題為“云智融合·共筑未來”的2023龍蜥操作系統(tǒng)大會圓滿結束。中央網(wǎng)信辦信息化發(fā)展局負責同志出席并致辭,中國工程院院士、原副院長陳左寧,中國科學院院士、CCF理事長、北

    標簽:
    云服務

熱門排行

信息推薦