1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

漫畫生產(chǎn)自動(dòng)化 小冰、百度們有興趣嗎?

 2021-04-04 18:33  來源:A5專欄  我來投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

文/ 智能相對論(ID:aixdlun)

作者/ 離離

近年,由于網(wǎng)絡(luò)的普及,動(dòng)漫作品傳播的速度不斷加快,二次元文化的受眾數(shù)量不斷上升,影響范圍也越來越廣泛。

如去年完結(jié)的日漫《鬼滅之刃》就成功“出圈”,掀起了現(xiàn)象級熱潮。原著漫畫為2020年日本漫畫銷量冠軍,累計(jì)發(fā)行量突破1億2000萬冊(含電子版),為第二名的十倍有余。其劇場版動(dòng)畫電影《鬼滅之刃:無限列車篇》上映后,更是在短時(shí)間內(nèi)突破300億日元票房,并持續(xù)刷新日本影史的各項(xiàng)紀(jì)錄。

看著日益廣闊的動(dòng)漫市場,一些廠商開始嘗試?yán)萌斯ぶ悄軄硗苿?dòng)漫畫生產(chǎn),希望能實(shí)現(xiàn)漫畫生產(chǎn)的自動(dòng)化,在提高生產(chǎn)效率的同時(shí)減少人力成本。

Made in AI的漫畫

“智能相對論”查到,一般的漫畫創(chuàng)作過程大致可分為三部份: 一是人物形象設(shè)計(jì);二是故事編排,包含情節(jié)、對話等文學(xué)腳本的寫作;三是角色、場景與分鏡配置等漫畫繪制。每位漫畫家都有不同的繪畫風(fēng)格和敘事方式。

去年,日本鎧俠株式會社(Kioxia Corporation)的研究人員與手冢工作室的藝術(shù)團(tuán)隊(duì)合作,利用人工智能深度學(xué)習(xí)技術(shù)完成世界上第一部由人類與AI協(xié)作的漫畫作品《PHAEDO》,高度還原了已故知名漫畫家手冢治蟲的漫畫風(fēng)格。

為了讓人工智能學(xué)習(xí)手冢的畫風(fēng)與筆觸,研究團(tuán)隊(duì)收集了十五萬張手冢漫畫手稿,利用圖像識別技術(shù)將其分類標(biāo)記,將角色面容等圖像特征轉(zhuǎn)換為數(shù)據(jù),再利用多個(gè)NVIDIA V100 GPU和cuDNN加速的TensorFlow深度學(xué)習(xí)框架(由StyleGAN編寫)進(jìn)行訓(xùn)練和推理。

在角色生成的訓(xùn)練中,研究團(tuán)隊(duì)還使用了手冢治蟲作品以外的多部不同漫畫的人物臉孔和真實(shí)的人臉照片來進(jìn)行訓(xùn)練,建立對抗性神經(jīng)網(wǎng)絡(luò)模型StyleGAN,讓其充分學(xué)習(xí)不同風(fēng)格、不同角度的漫畫人臉畫風(fēng)。

再使用遷移學(xué)習(xí)來整合成千上萬個(gè)數(shù)據(jù)點(diǎn),從粗糙的輪廓描繪逐漸細(xì)化至眼睛、嘴唇等細(xì)節(jié),讓AI所繪制的人像與手冢原作更加相似。

在腳本創(chuàng)作方面,研究團(tuán)隊(duì)將《森林大帝》《鐵臂阿童木》和《怪醫(yī)黑杰克》等上百個(gè)手冢治蟲的漫畫作品分解為多個(gè)段落,作為AI“學(xué)習(xí)”的對象。

分析了這些故事后,AI便能自動(dòng)生成多個(gè)故事大鋼。但這些由AI創(chuàng)作的故事中存在許多邏輯錯(cuò)誤,且只有五分之一具有意義,并充滿讓人意料之外的情節(jié)。

對于AI故事創(chuàng)作的不足,研究團(tuán)隊(duì)還是抱持較為樂觀的態(tài)度,將這些另類的想法和飛躍視為手冢治蟲漫畫作品之特色。最后,通過手冢工作室藝術(shù)團(tuán)隊(duì)的人工校正,《PHAEDO》的劇本才得以完成。這部作品已發(fā)表于日本漫畫雜志《Morning》與鎧俠的項(xiàng)目網(wǎng)站“TEZUKA 2020”。

影視劇改漫AI實(shí)現(xiàn)自動(dòng)化

除了現(xiàn)有的漫畫作品,真人影集也是漫畫的靈感來源之一。近期,來自大連理工大學(xué)和香港城市大學(xué)的研究團(tuán)隊(duì)提出了一款將視頻自動(dòng)轉(zhuǎn)換為靜態(tài)漫畫頁面的AI系統(tǒng),為人工智能圖像生成技術(shù)開拓了新的應(yīng)用道路。

與前陣子在各大社交軟件上流行的,將靜態(tài)照片變成動(dòng)畫的Avatarify相反。這款漫畫生成系統(tǒng)無需用戶手動(dòng)調(diào)整,即可將電視連續(xù)劇、電影、卡通等任意種類的影片,自動(dòng)變成帶有對話框及文字內(nèi)容的漫畫頁面。

首先,系統(tǒng)會依照每段字幕的時(shí)間將視頻分割成多個(gè)鏡頭,并藉由分析連續(xù)鏡頭的相似度與對話內(nèi)容,從中提取要轉(zhuǎn)換成漫畫的關(guān)鍵幀畫面。再將選取的關(guān)鍵幀源圖像轉(zhuǎn)換為黑白圖像,執(zhí)行量化與彩色風(fēng)格化,造就出“漫畫”風(fēng)格的圖像。

隨后,根據(jù)關(guān)鍵幀的興趣區(qū)域、重要性等級、彼此間的語義關(guān)系和頁面上的面板數(shù)量來決定漫畫的分格大小及數(shù)量,生成多頁面布局。

研究團(tuán)隊(duì)通過參考漫畫書中對話框形狀的多樣性,使用三種不同的氣泡形狀對應(yīng)不同情感的語句。并利用一些動(dòng)漫視頻與相應(yīng)漫畫作為訓(xùn)練素材,幫助系統(tǒng)學(xué)習(xí)識別影片中的聲音、字幕情感與相應(yīng)的氣泡形狀。

利用文本總結(jié)算法,系統(tǒng)可將相關(guān)字幕進(jìn)行合并,確保對話框中的句子不會太長,增強(qiáng)可讀性。再通過發(fā)言人物檢測和唇動(dòng)檢測,將帶有發(fā)言內(nèi)容的對話框放置在所屬人物附近。

該系統(tǒng)現(xiàn)階段依然有一些尚待解決的問題。例如關(guān)鍵幀的選擇上,一些畫面的相似度過高,仍有多余畫面;無字幕的視頻,單就語音識別生成的臺詞易出現(xiàn)錯(cuò)誤。雖然相較于其它方法生成的改漫作品,該系統(tǒng)的反響良好,但總體而言仍處于試驗(yàn)階段。研究團(tuán)隊(duì)表示,下一步希望能利用文本信息生成漫畫。

AI漫畫家走到哪了

“智能相對論”從《PHAEDO》和AI改漫系統(tǒng)的誕生可見,現(xiàn)階段的人工智能尚未具備獨(dú)立完成一部漫畫作品的能力。在文學(xué)藝術(shù)的創(chuàng)作上,AI尚未成熟;但在漫畫繪制過程中,AI對于畫風(fēng)與筆觸的模擬可說是“以假亂真”。

在二次元經(jīng)濟(jì)大規(guī)模崛起的環(huán)境下,中國的動(dòng)漫產(chǎn)值在近年步步高升,漫畫市場規(guī)模也呈現(xiàn)穩(wěn)定增長。這兩項(xiàng)技術(shù)若實(shí)現(xiàn)商業(yè)化,可讓漫畫家們從枯燥無味的重復(fù)勞動(dòng)中解放,集中心力完成情節(jié)、對話設(shè)置等藝術(shù)原創(chuàng)。不但能加快生產(chǎn)速度,同時(shí)也能減少人力成本,可說是具有一定的商業(yè)價(jià)值。

目前國內(nèi)部份公司已具備自動(dòng)制作漫畫所需的人工智能圖像識別、圖像繪制及文本自動(dòng)生成技術(shù),可說是具有進(jìn)入此市場的技術(shù)基礎(chǔ)。但漫畫自動(dòng)生成并非只是這些技術(shù)的堆疊與排序,現(xiàn)有的商業(yè)應(yīng)用方向似乎也并未覆蓋漫畫創(chuàng)作,還需要特定的數(shù)據(jù)庫和算法模型加以訓(xùn)練。

以人工智能生成動(dòng)漫圖象的技術(shù)為例,現(xiàn)在最普遍的商業(yè)模式為面向B端,替拍照軟件提供美漫、日漫、3D立體動(dòng)畫風(fēng)格的圖片生成服務(wù)?;谏蓪咕W(wǎng)絡(luò)GAN算法,不少公司都推出了頭像改漫、漫畫背景濾鏡等服務(wù),可將現(xiàn)實(shí)中的景觀與人像轉(zhuǎn)變成二次元?jiǎng)勇嬶L(fēng)。

如百度大腦AI開放平臺曾與B612咔嘰美顏相機(jī)合作,為用戶提供量身定做的二次元漫畫頭像定制、油畫風(fēng)格轉(zhuǎn)換服務(wù)。

騰訊光影研究室在QQ小世界、微視App、微博等社交平臺上推出的“王者臉”、“童話臉”等各類AI特效應(yīng)用,可將照片和直播視頻中的人物立刻變成游戲角色、真人“芭比”或“在逃公主”。

網(wǎng)易游戲《逆水寒》《天諭》的智能捏臉也是基于AI圖象生成技術(shù)。玩家上傳一張2D照片后,系統(tǒng)可自動(dòng)生成相似度超高的3D臉部模型,甚至連發(fā)型都能自動(dòng)生成。

這些基于圖片識別與生成對抗網(wǎng)絡(luò)的AI動(dòng)漫圖象生成技術(shù)可將已有的照片轉(zhuǎn)換為漫畫風(fēng)格,具有影視改漫自動(dòng)化的技術(shù)基礎(chǔ)。但要像TEZUKA 2020項(xiàng)目那樣“無中生有”固定風(fēng)格的漫畫作品,似乎還需要一些訓(xùn)練。

就這點(diǎn)而言,曾“就讀”中央美術(shù)學(xué)院的小冰或許離AI漫畫家更近一些。“學(xué)習(xí)”兩百多位著名人類畫家的作品后,小冰可在接收到文本或其他創(chuàng)作刺激后獨(dú)立完成原創(chuàng)的命題畫作。不僅曾在中央美術(shù)學(xué)院美術(shù)館舉辦個(gè)人畫展,還將這項(xiàng)能力應(yīng)用于絲巾、服裝等紡織面料及圖案設(shè)計(jì),實(shí)現(xiàn)商業(yè)化。

在故事腳本生成方面,雖然人工智能已具備撰寫近體詩、新詩、新聞稿、廣告文案等各類文體的能力,但目前對智能寫作需求最大、黏性最強(qiáng)的四個(gè)市場分別是內(nèi)容資訊、金融財(cái)經(jīng)分析、數(shù)字營銷和行政辦公。

因此,國內(nèi)已實(shí)現(xiàn)商業(yè)化的AI寫作產(chǎn)品大多針對營銷、政務(wù)等領(lǐng)域,以角色對話推進(jìn)故事發(fā)展的漫畫文稿等藝術(shù)創(chuàng)作方面的應(yīng)用較少。

如阿里發(fā)布的“AI智能文案”產(chǎn)品結(jié)合淘寶、天貓的海量內(nèi)容與自然語言算法,聚焦于電商營銷文案,可模擬多種風(fēng)格、自定義字?jǐn)?shù)并實(shí)時(shí)學(xué)習(xí)在線樣本,一秒內(nèi)可生成兩萬條短標(biāo)題。

金山WPS智能寫作的訓(xùn)練數(shù)據(jù)源于權(quán)威媒體與政府公開網(wǎng)站,常用于公文寫作。支持文本自動(dòng)生成、輔助成搞寫作、智能素材推薦等服務(wù),在政務(wù)系統(tǒng)的覆蓋率較高。

“智能相對論”看到,百度智能創(chuàng)作平臺也帶有自動(dòng)寫作功能,既有針對財(cái)經(jīng)、體育數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)寫作,還有智能寫詩、智能春聯(lián)等API服務(wù)。而小冰框架不僅曾經(jīng)出版現(xiàn)代詩集,還為萬得資訊、華爾街見聞等公司提供金融摘要自動(dòng)生成服務(wù)。

由此可見,雖然制作漫畫所需的AI技術(shù)已發(fā)展出較為成熟的商業(yè)模式,但這些技術(shù)大多被作為單獨(dú)的服務(wù)或產(chǎn)品分開使用,應(yīng)用方向也各有不同。 比起其他的AI系統(tǒng),小冰和百度等同時(shí)具備文本寫作與繪畫能力的人工智能框架可能較有成為AI漫畫家的潛力,但目前看來,國內(nèi)公司似乎并未將人工智能大規(guī)模應(yīng)用于漫畫生產(chǎn),更別說是形成“一條龍”的漫畫自動(dòng)生成產(chǎn)業(yè)鏈。

2015年,中國的漫畫產(chǎn)業(yè)進(jìn)入了高速增長期,并持續(xù)保有較高的增長率,在2019年開始進(jìn)入平穩(wěn)增長期。據(jù)2020年6月發(fā)布的《2020微博動(dòng)漫白皮書》顯示,微博泛二次元用戶同比增長11.4%,連續(xù)4年保持增長;54%的動(dòng)漫用戶是內(nèi)容付費(fèi)用戶。

在二次元用戶數(shù)量與市場規(guī)模不斷擴(kuò)增的今日,消費(fèi)者逐漸養(yǎng)成為內(nèi)容付費(fèi)的習(xí)慣,付費(fèi)商業(yè)模式助于刺激生產(chǎn),創(chuàng)作者們也不斷探索新的漫畫表現(xiàn)形式。如介于動(dòng)畫與漫畫之間的動(dòng)態(tài)漫畫、經(jīng)由用戶觸摸或搖晃設(shè)備而推動(dòng)內(nèi)容情節(jié)發(fā)展的互動(dòng)漫畫。

無論是需要耗費(fèi)大量人力的靜態(tài)漫畫,還是這些制作周期更長、投入成本更高的新形態(tài)漫畫,若能在內(nèi)容生產(chǎn)上降低成本、提高產(chǎn)出效率,不但能讓作者省下重復(fù)勞動(dòng)的時(shí)間精力,得以更專注于打磨作品;也能降低漫畫生產(chǎn)門檻,迸發(fā)出更多藝術(shù)可能。

在“國漫崛起”的現(xiàn)在,使用AI來加快漫畫生產(chǎn)似乎是個(gè)不錯(cuò)的想法。就像參與《Phaedo》項(xiàng)目的科學(xué)家松原仁所說的,AI和人類合作畫漫畫是理所當(dāng)然的未來。

申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
ai技術(shù)

相關(guān)文章

  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • 王通:未來個(gè)人創(chuàng)業(yè)的十個(gè)機(jī)會

    個(gè)人創(chuàng)業(yè)需要啟動(dòng)成本低、無需龐大團(tuán)隊(duì)、可快速驗(yàn)證、能利用個(gè)人技能或資源。這里分享適合個(gè)人創(chuàng)業(yè)的十個(gè)機(jī)會一.AI內(nèi)容優(yōu)化與本地化服務(wù)·做什么:幫助企業(yè)或個(gè)人利用AI工具(如GPT-4,Midjourney)優(yōu)化內(nèi)容生產(chǎn)流程。例如,為跨境電商撰寫多語言產(chǎn)品描述,為小紅書博主生成爆款文案,為小公司制作營銷

  • 百度智能云PaddleOCR 3.1正式發(fā)布:關(guān)鍵能力支持MCP

    百度AI團(tuán)隊(duì)今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標(biāo)志著OCR領(lǐng)域首次實(shí)現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準(zhǔn)識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場

    標(biāo)簽:
    ai智能
    ai技術(shù)
  • AI工具導(dǎo)航網(wǎng)站,未來的發(fā)展前景怎么樣?

    導(dǎo)航網(wǎng)站的崛起:從信息過載到精準(zhǔn)觸達(dá)隨著全球AI工具數(shù)量爆發(fā)式增長(2025年已超數(shù)萬款),用戶面臨前所未有的選擇困境。傳統(tǒng)搜索引擎的“關(guān)鍵詞-鏈接”模式難以應(yīng)對工具篩選的場景需求,垂直化、場景化的AI導(dǎo)航網(wǎng)站應(yīng)運(yùn)而生。這類平臺通過聚合、評測、分類與推薦四重機(jī)制,將分散的工具資源整合為結(jié)構(gòu)化入口。例

  • 微信AI搜索被指“強(qiáng)行開盒”:名字成了數(shù)據(jù)入口,騰訊回應(yīng)“僅用公開信息”

    當(dāng)微信公眾號文章中出現(xiàn)一個(gè)人的名字,它會自動(dòng)變成藍(lán)色鏈接,點(diǎn)擊即可查看AI生成的“個(gè)人簡歷”——這一微信新功能讓不少用戶感到被“扒光”在互聯(lián)網(wǎng)上。近日,微信新上線的“AI搜索”功能陷入隱私泄露爭議漩渦。多位網(wǎng)友在社交平臺反映,當(dāng)微信公眾號推文中出現(xiàn)本人姓名時(shí),名字會自動(dòng)變?yōu)樗{(lán)色超鏈接,點(diǎn)擊即可瀏覽由

    標(biāo)簽:
    ai技術(shù)
    ai搜索
  • 弈動(dòng) Dynamic·數(shù)智躍遷 博弈無界|2025TechWorld智慧安全大會在京召開

    在數(shù)字化與智能化深度交織的時(shí)代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動(dòng)Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會在北京盛大召開。來自國家部委、院士學(xué)者、高??蒲袡C(jī)構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)

    標(biāo)簽:
    弈動(dòng)
  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    標(biāo)簽:
    阿里巴巴
  • 未來5年,中國AI的“大洗牌”和“內(nèi)循環(huán)”

    我覺得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國產(chǎn)開車26年國產(chǎn)芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就

  • H20芯片開賣即叫停,英偉達(dá)如何解圍?

    文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標(biāo)簽:
    英偉達(dá)
  • 真正的「國產(chǎn)英偉達(dá)」來了

    文/二風(fēng)來源/節(jié)點(diǎn)財(cái)經(jīng)一場關(guān)于“中國芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請。作為中國半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心,以及在國產(chǎn)GPU領(lǐng)域取

    標(biāo)簽:
    英偉達(dá)