1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

AI技術(shù)讓手辦「整活」:3D建模居然可以這樣簡單

 2022-09-01 11:19  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領(lǐng)券再下單

科技領(lǐng)域,既有用元宇宙開發(fā)布會的公司,也有All in元宇宙的公司,很多虛擬世界已經(jīng)建立起來,人們面臨的問題正在變成:真實世界中,人類創(chuàng)造了億萬種物品豐富著我們的生活,那么如何才能快速復(fù)制這些物品到全新的元宇宙世界中呢?

3D內(nèi)容對于元宇宙至關(guān)重要,很多科技公司正在推出用于構(gòu)建虛擬世界的工具,隨著計算機圖形技術(shù)、元宇宙和AI之間的交集越來越多,這些技術(shù)也在不斷升級。

最近,華為HMS Core 3D建模服務(wù)發(fā)布了人形角色自動建模和骨骼綁定的功能,引起了我們的注意。

看到一個可愛的手辦,在想能不能擁有它的3D虛擬形象?只用手機圍繞手辦拍攝一圈,就能構(gòu)建一個造型精準的3D模型并為其自動綁定骨骼。

在導(dǎo)入動作數(shù)據(jù)后,它不僅可以隨你走動、向你招手,還可以完成跳舞等復(fù)雜動作。

在開放的Demo App中,我們只需要用普通手機攝像頭圍繞目標物體進行一通360度拍攝,清晰的3D模型即可生成。除了Q版的動漫手辦以外,毛絨玩具或者機器人等人形角色也可以被掃描成模型并賦予骨骼。

那么它的能力到底如何呢?我們也實際操作了一把,我們用華為的技術(shù)給機器之心的毛絨玩偶構(gòu)建了3D模型并綁定好骨骼。

只需使用視頻中的同款動作數(shù)據(jù)驅(qū)動模型,就可以跳同款舞蹈啦:

如果四肢短小的玩偶都可以搞定的話,看起來絕大多數(shù)人形角色都是沒問題的!

通過AI能力用2D照片生成3D模型,是人工智能學(xué)術(shù)會議中的一個熱門領(lǐng)域,剛剛過去的國際頂會CVPR上就有數(shù)十篇這個方向的論文。通過對物體的不同角度進行拍攝,將2D圖像轉(zhuǎn)換為三角網(wǎng)格模型,生成的3D模型可供建筑師、設(shè)計師、藝術(shù)家和游戲開發(fā)者導(dǎo)入圖形引擎,并可以在此基礎(chǔ)上修改比例、更改材料或嘗試不同的照明效果。而如今,前沿技術(shù)的一部分已經(jīng)成為了手機上的應(yīng)用,不禁讓人感嘆科技發(fā)展的速度。

3D建模,手機也行

快速構(gòu)建3D模型的能力來自華為終端云服務(wù)開放能力合集HMS Core,其擁有3D建模、3D引擎、AR Engine等多個圖形領(lǐng)域的開放服務(wù)。其中,3D建模服務(wù)可以給我們帶來很多想象空間,可以用在商品展示、教學(xué)、虛擬人物,甚至動畫制作上。

華為HMS Core 3D建模服務(wù),不需要用TOF、深度攝像頭或LiDAR激光雷達等特殊硬件,只需要一個普通手機的RGB攝像頭即可完成建模。

這個過程在使用者看來是「一鍵生成」的,背后經(jīng)歷的卻是一系列復(fù)雜的處理過程。

高精度的幾何重建需要先進行物體分割,將目標物與背景分離,并進行圖像匹配、特征提取和深度估計,AI算法通過分析不同角度的圖像來判斷位置關(guān)系,生成點云構(gòu)建3D模型,再計算出紋理材質(zhì)對模型表面進行貼圖。

在這個過程中,華為利用自研的高低模技術(shù),通過計算剔除冗余的面片,可以用更低的面片數(shù)(5萬以下)達成高面片數(shù)(10萬及以上)模型的效果,在中低端手機上也能實現(xiàn)精細的視覺效果。

自動 生成3D 虛擬形象的「筋骨」

為了讓模型動起來,我們還需要對模型進行「骨骼綁定」:

傳統(tǒng)流程中,骨骼綁定也需要動畫師手工來完成,HMS Core的能力大幅提升了動畫制作的效率:通過自動的骨骼綁定和蒙皮權(quán)重估計,HMS Core可以讓你剛剛掃描出來的3D模型在導(dǎo)入動作數(shù)據(jù)后活動起來。

值得一提的是,在這個領(lǐng)域,此前少數(shù)實現(xiàn)自動關(guān)節(jié)估計的方法都需要目標模型擺好標準姿態(tài)。華為利用AI算法減少了人為規(guī)則的需求,可以支持非對稱的多種姿態(tài)。

面對模型的各種姿態(tài),AI算法需要大量數(shù)據(jù)進行訓(xùn)練,但在3D模型重建任務(wù)上,業(yè)內(nèi)其實并沒有這樣的數(shù)據(jù)集。

對此,華為自研了一套3D人形角色自動生成框架,可以基于千百個模型數(shù)據(jù),生成數(shù)十萬甚至是上百萬的角色模型和骨骼。通過數(shù)據(jù)增強,HMS Core支持了非對稱姿態(tài)、不同體型和類別的人形角色的自動骨骼綁定。

投射到現(xiàn)實世界

最后,若想將構(gòu)建好的3D模型呈現(xiàn)在真實的世界中,實現(xiàn)真人與3D虛擬物體交互的效果,還需要準確高效的AR能力。

華為HMS Core的AR Engine通過整合算法實現(xiàn)了厘米級的精準定位,開發(fā)者可以通過這些能力讓虛擬世界與現(xiàn)實世界自然地融合在一起。

例如,AR Engine提供了光照估計和環(huán)境Mesh能力,使得3D虛擬形象的影子會隨著燈光變化,并可被現(xiàn)實世界中的物體擋住,帶來更自然的視覺交互體驗。

圖形領(lǐng)域能力全面 開放,加速元宇宙時代到來

隨著業(yè)界虛實融合步伐加快,華為HMS Core全面開放圖形領(lǐng)域的相關(guān)能力,助力開發(fā)者高效構(gòu)建虛實融合的數(shù)字世界。

圖片來自2022年7月HUAWEI Developer Day(簡稱HDD)杭州站主論壇現(xiàn)場

開發(fā)者可以通過直接調(diào)用軟件接口獲得華為圖形領(lǐng)域的核心能力,節(jié)省大量時間和精力,高效完成應(yīng)用開發(fā)。

相信有了這種能力的加持,或許下一個爆款的App已在路上,元宇宙時代也將加速到來。(文章來源于公眾號:機器之心)

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標簽
元宇宙
ai技術(shù)

相關(guān)文章

  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標簽:
    ai技術(shù)
  • 王通:未來個人創(chuàng)業(yè)的十個機會

    個人創(chuàng)業(yè)需要啟動成本低、無需龐大團隊、可快速驗證、能利用個人技能或資源。這里分享適合個人創(chuàng)業(yè)的十個機會一.AI內(nèi)容優(yōu)化與本地化服務(wù)·做什么:幫助企業(yè)或個人利用AI工具(如GPT-4,Midjourney)優(yōu)化內(nèi)容生產(chǎn)流程。例如,為跨境電商撰寫多語言產(chǎn)品描述,為小紅書博主生成爆款文案,為小公司制作營銷

  • 百度智能云PaddleOCR 3.1正式發(fā)布:關(guān)鍵能力支持MCP

    百度AI團隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標志著OCR領(lǐng)域首次實現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場

  • AI工具導(dǎo)航網(wǎng)站,未來的發(fā)展前景怎么樣?

    導(dǎo)航網(wǎng)站的崛起:從信息過載到精準觸達隨著全球AI工具數(shù)量爆發(fā)式增長(2025年已超數(shù)萬款),用戶面臨前所未有的選擇困境。傳統(tǒng)搜索引擎的“關(guān)鍵詞-鏈接”模式難以應(yīng)對工具篩選的場景需求,垂直化、場景化的AI導(dǎo)航網(wǎng)站應(yīng)運而生。這類平臺通過聚合、評測、分類與推薦四重機制,將分散的工具資源整合為結(jié)構(gòu)化入口。例

  • 微信AI搜索被指“強行開盒”:名字成了數(shù)據(jù)入口,騰訊回應(yīng)“僅用公開信息”

    當(dāng)微信公眾號文章中出現(xiàn)一個人的名字,它會自動變成藍色鏈接,點擊即可查看AI生成的“個人簡歷”——這一微信新功能讓不少用戶感到被“扒光”在互聯(lián)網(wǎng)上。近日,微信新上線的“AI搜索”功能陷入隱私泄露爭議漩渦。多位網(wǎng)友在社交平臺反映,當(dāng)微信公眾號推文中出現(xiàn)本人姓名時,名字會自動變?yōu)樗{色超鏈接,點擊即可瀏覽由

  • 弈動 Dynamic·數(shù)智躍遷 博弈無界|2025TechWorld智慧安全大會在京召開

    在數(shù)字化與智能化深度交織的時代浪潮中,安全的邊界不斷延展,技術(shù)的演進正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會在北京盛大召開。來自國家部委、院士學(xué)者、高??蒲袡C構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)

    標簽:
    弈動
  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標簽:
    ai技術(shù)
  • AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    標簽:
    阿里巴巴
  • 未來5年,中國AI的“大洗牌”和“內(nèi)循環(huán)”

    我覺得我們AI的目標是:從芯片設(shè)計到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達造車、國產(chǎn)開車26年國產(chǎn)芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會以軟件彌補硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就

  • H20芯片開賣即叫停,英偉達如何解圍?

    文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問詢之后,英偉達的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達已悄然向其關(guān)鍵供應(yīng)商——包括負責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標簽:
    英偉達
  • 真正的「國產(chǎn)英偉達」來了

    文/二風(fēng)來源/節(jié)點財經(jīng)一場關(guān)于“中國芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請。作為中國半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達背景、高達80億元人民幣的募資雄心,以及在國產(chǎn)GPU領(lǐng)域取

    標簽:
    英偉達