1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

李明強(qiáng):AI鑒黃師"看懂"圖像迅速走紅

 2018-09-11 18:12  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領(lǐng)券再下單

受訪者供圖

“你的第一個產(chǎn)品,哪怕做得粗糙一點(diǎn)也沒關(guān)系,不要想太多!”5年前,李明強(qiáng)帶著騰訊高級副總裁張小龍的“臨別贈言”,躍入創(chuàng)業(yè)的大潮中。共事多年的張小龍給他的建議是,“產(chǎn)品并不需要做得完美無瑕再拿出去。只要有客戶,就說明是有需求的。”

1980年出生的李明強(qiáng)在騰訊工作了7年,先后參與QQ郵箱、微信等項目的開發(fā),成了一名資深的項目經(jīng)理和T4技術(shù)專家。“我離開騰訊時,公司只有幾十個T4技術(shù)專家。但我在那里太久了,再不出去創(chuàng)業(yè)就折騰不動了。”2014年,他創(chuàng)辦了國內(nèi)最早將計算機(jī)視覺技術(shù)應(yīng)用在互聯(lián)網(wǎng)內(nèi)容審核上的AI公司——圖普科技。

“內(nèi)容審查怎么不能做到?我就可以做!”

圖普科技從“出生”時起,就打上了“鑒黃”的烙印。這源于曾經(jīng)掀起輿論熱議的“快播案”??觳EO王欣在法庭上稱:“快播最主要的功能就是播放,就像傳統(tǒng)意義上的DVD,無法知道上傳者是誰,更不知道視頻內(nèi)容是什么。用戶上傳什么種子,它就播放下載什么種子,它只是忠實(shí)地執(zhí)行這個動作而已。”

李明強(qiáng)說:“內(nèi)容審查在當(dāng)時的確很難。我就想怎么不能做到?我就可以做!”

根據(jù)《全國人民代表大會常務(wù)委員會關(guān)于維護(hù)互聯(lián)網(wǎng)安全的決定》的規(guī)定,互聯(lián)網(wǎng)公司內(nèi)容涉黃,有可能被以制作、復(fù)制、出版、販賣、傳播淫穢物品牟利罪定罪處罰??觳テ飘a(chǎn)的結(jié)局讓眾多網(wǎng)絡(luò)平臺意識到,內(nèi)容審核不僅是維護(hù)互聯(lián)網(wǎng)環(huán)境的政策要求,更是關(guān)及自身生死存亡的要事。

如今,直播和短視頻市場風(fēng)起云涌,龐大的流量催生新產(chǎn)業(yè)的同時,審核難度也越來越大。據(jù)新華社報道,今年以來,“掃黃打非”部門加大工作力度。據(jù)統(tǒng)計,“凈網(wǎng)2018”行動從1月到4月,各地共處置淫穢色情等有害信息175萬余條,查辦淫穢色情信息案件390余起。

被網(wǎng)友戲稱高薪和“福利”兼具的神奇職業(yè)“鑒黃師”,在如此大體量的內(nèi)容檢測面前顯得勢單力薄。“培養(yǎng)一個鑒黃師至少需要兩周。”李明強(qiáng)說,“一天總共8萬多秒,去掉吃飯睡覺等時間,鑒黃師一天最多能看一兩萬張圖片。人工審核難免會有錯漏,還要考慮人員流動、不能實(shí)時監(jiān)看等不穩(wěn)定的因素。”

受到快播案的啟發(fā),李明強(qiáng)確立了用人工智能技術(shù)進(jìn)行圖片識別的戰(zhàn)略,他帶著新建的團(tuán)隊,在一周內(nèi)做出demo(小樣),在給機(jī)器提供大量數(shù)據(jù)的基礎(chǔ)上,通過機(jī)器持續(xù)學(xué)習(xí),確保系統(tǒng)甄別效能的更新和優(yōu)化。

隨后圖普迎來第一個客戶——迅雷。迅雷之前成立了自己的內(nèi)容審核團(tuán)隊。“他們的做法是將違規(guī)內(nèi)容和審核視頻進(jìn)行比對,將一樣的部分篩去,但是機(jī)器并不理解這個東西是什么。”李明強(qiáng)說,“一個視頻版本傳播出去會有多個變種,分辨率不同、加個水印、字幕或者截取部分,就演變成完全不同的文件了。我們的創(chuàng)新點(diǎn)在于,我們的識別是基于圖像的理解,真的能‘看懂’視頻是否有色情內(nèi)容”。

“我們在識別的結(jié)果上,會劃線區(qū)分為確定和不確定部分。有的圖片非常隱晦,它介于兩者之間,系統(tǒng)的判定是不確定或者很模糊。因此我們也設(shè)立新的計費(fèi)模式,只對于確定部分收費(fèi),不確定部分不收費(fèi)或者少收費(fèi),打消客戶的很多疑慮。”李明強(qiáng)解釋,圖普科技的準(zhǔn)確率高達(dá)99%,對于系統(tǒng)無法識別或無法作出最終判斷的內(nèi)容,推送至人工審核。盡管還需要鑒黃師的助力,但已經(jīng)極大地提高效率和降低人力成本。

目前,圖普科技的AI每天的處理量超過10億次,在云端設(shè)有幾百個圖像識別接口,相關(guān)的算法也落地到不同的行業(yè)里。

“每次嘗試我都更興奮,會有這一次要成功了的錯覺”

任何成功都不是一蹴而就。在圖普科技成長為“AI鑒黃師”之前,李明強(qiáng)有過一次失敗的創(chuàng)業(yè)經(jīng)歷。

2013年,李明強(qiáng)嘗試開發(fā)一個服裝和鞋帽的搜索引擎,通過圖片來了解用戶喜好并推薦適合用戶的款式。“在當(dāng)時就能夠完成識別圖中衣物款式、顏色、紋理等一些當(dāng)時看起來很有難度的事”,但初次創(chuàng)業(yè)不過一年便宣告失敗。

李明強(qiáng)期望能從圖片為切口,突破單一的純文字搜索引擎模式,但高成本的流量和時間消耗難以承受?;仡欉^去的創(chuàng)業(yè)經(jīng)歷,運(yùn)營工作太重是失敗的主要原因。用戶對于服裝的偏好、對美的感受千差萬別,需要進(jìn)行大量的運(yùn)營工作。

這成為李明強(qiáng)最頭痛的事,“盡管我們嘗試將每一次需求沉淀下來再去改進(jìn),但還是會有新的或者隱晦的需求,一次又一次遭受打擊。依靠技術(shù)難以量化和把握,無法完成完整的商業(yè)閉環(huán)。”

“這是一次非常慘痛的創(chuàng)業(yè)經(jīng)歷。”從騰訊的高級技術(shù)專家,到事無巨細(xì)考慮每一步的創(chuàng)業(yè)老板,身份的轉(zhuǎn)換帶給了李明強(qiáng)極大的不適應(yīng)感,“就像一覺醒來漂流在海面上,狂風(fēng)暴雨,又不知道該往什么方向去走。”

當(dāng)初,李明強(qiáng)帶著幾位伙伴一起離開騰訊著手創(chuàng)業(yè)。他形容“自己的兄弟特別單純”,“他們就相信我這件事情能做成”。

搜衣引擎的失敗給了李明強(qiáng)當(dāng)頭一棒。比起自己的挫敗感,李明強(qiáng)對共同戰(zhàn)斗的隊友背負(fù)更深的愧疚。

“帶著一幫兄弟,拿著投資人的錢花時間在這個地方,最后發(fā)現(xiàn)都是一些無效勞動。”那一次失敗,讓李明強(qiáng)損失了一半得力干將。他覺得,“失敗就像一個坑,陷進(jìn)去了就得爬出來。如何找到方向爬出坑最重要”。

“就是不斷嘗試。”李明強(qiáng)在接受中國青年報·中青在線記者采訪時說,“每一次嘗試我都更興奮,會有這一次要成功了的錯覺,但結(jié)果方向又不對,那就再來!”

每一次調(diào)整狀態(tài)后,他又像打滿了雞血一般,迎接新的挑戰(zhàn),“這件事情一年做不成,我就做十年。因?yàn)槲抑揽隙ㄊ谴嬖谝粭l路的。”李明強(qiáng)終于找到了這條路,開創(chuàng)了國內(nèi)人工智能圖片識別內(nèi)容審核的先河。

員工的學(xué)習(xí)時間計入工時——拿工資學(xué)習(xí)

“AI鑒黃師”迅速走紅。參加了多場人工智能研討會后,李明強(qiáng)發(fā)現(xiàn),“只要一說我們的產(chǎn)品是AI鑒黃,之后再說到其他業(yè)務(wù)大家就都不注意聽了”。

“后來想想我們本來就是互聯(lián)網(wǎng)出身,能有這樣的免費(fèi)熱點(diǎn)蹭,也沒什么不好。 ”李明強(qiáng)介紹,如今圖普科技三條生產(chǎn)線并行:互聯(lián)網(wǎng)、商業(yè)智能、泛安防。鑒黃只是互聯(lián)網(wǎng)生產(chǎn)線的一個小分支。今年圖普科技在商業(yè)智能上持續(xù)發(fā)力,線下門店都開始嘗試配備AI的自動導(dǎo)購機(jī),例如通過攝像頭來識別消費(fèi)者的形象特征,隨后根據(jù)算法在屏幕上顯示推薦產(chǎn)品,在應(yīng)用中增添很多趣味性的成分,“這實(shí)際上是我們做賦能型零售的破冰嘗試。”

目前,圖普科技總部設(shè)在廣州,在北京、成都等地開設(shè)了分公司,160多人的團(tuán)隊中研發(fā)人員占70%。招到優(yōu)秀的人是李明強(qiáng)最關(guān)心的事,他和程序員在工作之余“玩”出了5套謎題,以游戲的形式作為選拔人才的考卷。

“這一套謎題是用算法摳出圖里的馬里奧,這張海報的圖標(biāo)是《三體》里的魚缸……”他甚至在公司開設(shè)解題課堂,定期講解這些內(nèi)容。他還設(shè)計了打卡學(xué)習(xí)系統(tǒng),員工的學(xué)習(xí)時間計入工時——拿工資學(xué)習(xí)。

如今,李明強(qiáng)和公司成員溝通時,常常將“在用的過程中完善”這句話掛在嘴邊。李明強(qiáng)坦言,“我一開始總想要把產(chǎn)品做完善再拿出去,反而越做越糟。張小龍的忠告是對的,產(chǎn)品就是應(yīng)該在推出后根據(jù)需求迭代的。我們也正在不斷更新產(chǎn)品,永遠(yuǎn)在路上。”(實(shí)習(xí)生 黃暢 中國青年報·中青在線記者 王聰聰)

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • 王通:未來個人創(chuàng)業(yè)的十個機(jī)會

    個人創(chuàng)業(yè)需要啟動成本低、無需龐大團(tuán)隊、可快速驗(yàn)證、能利用個人技能或資源。這里分享適合個人創(chuàng)業(yè)的十個機(jī)會一.AI內(nèi)容優(yōu)化與本地化服務(wù)·做什么:幫助企業(yè)或個人利用AI工具(如GPT-4,Midjourney)優(yōu)化內(nèi)容生產(chǎn)流程。例如,為跨境電商撰寫多語言產(chǎn)品描述,為小紅書博主生成爆款文案,為小公司制作營銷

  • 百度智能云PaddleOCR 3.1正式發(fā)布:關(guān)鍵能力支持MCP

    百度AI團(tuán)隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標(biāo)志著OCR領(lǐng)域首次實(shí)現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準(zhǔn)識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場

    標(biāo)簽:
    ai智能
    ai技術(shù)
  • AI工具導(dǎo)航網(wǎng)站,未來的發(fā)展前景怎么樣?

    導(dǎo)航網(wǎng)站的崛起:從信息過載到精準(zhǔn)觸達(dá)隨著全球AI工具數(shù)量爆發(fā)式增長(2025年已超數(shù)萬款),用戶面臨前所未有的選擇困境。傳統(tǒng)搜索引擎的“關(guān)鍵詞-鏈接”模式難以應(yīng)對工具篩選的場景需求,垂直化、場景化的AI導(dǎo)航網(wǎng)站應(yīng)運(yùn)而生。這類平臺通過聚合、評測、分類與推薦四重機(jī)制,將分散的工具資源整合為結(jié)構(gòu)化入口。例

  • 微信AI搜索被指“強(qiáng)行開盒”:名字成了數(shù)據(jù)入口,騰訊回應(yīng)“僅用公開信息”

    當(dāng)微信公眾號文章中出現(xiàn)一個人的名字,它會自動變成藍(lán)色鏈接,點(diǎn)擊即可查看AI生成的“個人簡歷”——這一微信新功能讓不少用戶感到被“扒光”在互聯(lián)網(wǎng)上。近日,微信新上線的“AI搜索”功能陷入隱私泄露爭議漩渦。多位網(wǎng)友在社交平臺反映,當(dāng)微信公眾號推文中出現(xiàn)本人姓名時,名字會自動變?yōu)樗{(lán)色超鏈接,點(diǎn)擊即可瀏覽由

    標(biāo)簽:
    ai技術(shù)
    ai搜索
  • 弈動 Dynamic·數(shù)智躍遷 博弈無界|2025TechWorld智慧安全大會在京召開

    在數(shù)字化與智能化深度交織的時代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會在北京盛大召開。來自國家部委、院士學(xué)者、高??蒲袡C(jī)構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)

    標(biāo)簽:
    弈動
  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    標(biāo)簽:
    阿里巴巴
  • 未來5年,中國AI的“大洗牌”和“內(nèi)循環(huán)”

    我覺得我們AI的目標(biāo)是:從芯片設(shè)計到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國產(chǎn)開車26年國產(chǎn)芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就

  • H20芯片開賣即叫停,英偉達(dá)如何解圍?

    文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標(biāo)簽:
    英偉達(dá)
  • 真正的「國產(chǎn)英偉達(dá)」來了

    文/二風(fēng)來源/節(jié)點(diǎn)財經(jīng)一場關(guān)于“中國芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請。作為中國半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心,以及在國產(chǎn)GPU領(lǐng)域取

    標(biāo)簽:
    英偉達(dá)