2019年數(shù)字生態(tài)大會(huì)于5月21日—23日在昆明舉行,在AI分論壇上,騰訊優(yōu)圖實(shí)驗(yàn)室聯(lián)合負(fù)責(zé)人、杰出科學(xué)家賈佳亞分享了優(yōu)圖近期在AI手語識別上取得的突破——推出基于自研算法的“優(yōu)圖AI手語翻譯機(jī)”。
據(jù)賈佳亞介紹,AI手語翻譯機(jī)以普通攝像頭作為手語采集裝置,依托高性能計(jì)算機(jī)進(jìn)行后臺(tái)運(yùn)算,用戶只要正對攝像頭完成手語表達(dá),翻譯機(jī)就能快速運(yùn)算出結(jié)果并把手語翻譯成為文字。未來有望在機(jī)場、民政窗口等公共場所部署和落地,助力信息無障礙城市建設(shè)。
(騰訊優(yōu)圖實(shí)驗(yàn)室聯(lián)合負(fù)責(zé)人、騰訊杰出科學(xué)家 賈佳亞)
AI手語翻譯機(jī):自研算法,實(shí)現(xiàn)手語識別“黑科技”
手語識別(SLR),就是指通過計(jì)算機(jī)算法,自動(dòng)區(qū)分手語表達(dá)中的各類手勢、動(dòng)作以及這些手勢和動(dòng)作之間的切換,最后將表達(dá)的手語翻譯成文字。不過相比于其他AI視覺識別技術(shù)的研究,手語識別的研發(fā)卻存在更大的困難和挑戰(zhàn)。手語表達(dá)所特有的地域性、復(fù)雜性和多樣性極大地增加了數(shù)據(jù)采集與清洗的難度和成本,而受限于數(shù)據(jù)量的大小和人工設(shè)計(jì)特征的缺陷,很多傳統(tǒng)研究的研究方法在適應(yīng)性、泛化性及魯棒性上都十分有限。

(優(yōu)圖AI手語翻譯機(jī)界面)
據(jù)賈佳亞介紹,此次騰訊優(yōu)圖推出的AI手語翻譯機(jī),結(jié)合聽障人士手語表達(dá)的習(xí)慣采集手語數(shù)據(jù),參考先進(jìn)的手勢識別、動(dòng)作識別和序列翻譯等技術(shù),通過自研算法實(shí)現(xiàn)了對復(fù)雜手語表達(dá)的識別技術(shù)突破。相較于其他方法,優(yōu)圖AI手語翻譯機(jī)的數(shù)據(jù)集覆蓋了近千句日常表達(dá),900個(gè)常用詞匯,同時(shí)對數(shù)據(jù)進(jìn)行進(jìn)一步的分析和歸納,擁有目前最大的中文手語識別數(shù)據(jù)集,并支持整句手語表達(dá)的識別,可直接判斷用戶是否結(jié)束并完成實(shí)時(shí)翻譯。
應(yīng)用探索:視覺AI,助力信息無障礙建設(shè)
據(jù)北京聽力協(xié)會(huì)2017年公開數(shù)據(jù),估計(jì)中國殘疾性聽力障礙人士已達(dá)7200萬,相當(dāng)于北京市常住人口(約2200萬,2015年數(shù)據(jù))的3倍多。盡管我國在信息無障礙領(lǐng)域的投入逐漸增加,但目前國內(nèi)的聽障人群需求依然得不到滿足。優(yōu)圖AI手語翻譯機(jī)的推出將一定程度地緩解聽障人士的交流障礙。
在演講中,賈佳亞表示,“未來,我們希望通過與聾啞人士或手語使用者的深入接觸,嘗試在公共事物場所為聽障者提供更好的服務(wù),更好地助力信息無障礙的建設(shè)。”下一步,優(yōu)圖實(shí)驗(yàn)室將對AI手語翻譯機(jī)展開優(yōu)化和升級,嘗試在日常服務(wù)窗口、手語教育等場景中落地,為聽障人士帶來實(shí)實(shí)在在的便利。
目前,優(yōu)圖實(shí)驗(yàn)室已經(jīng)和深圳市信息無障礙研究會(huì)成立AI手語識別聯(lián)合項(xiàng)目組,就手語數(shù)據(jù)采集、產(chǎn)品算法優(yōu)化等方面展開長期深度合作,并通過與聽障者或手語使用者進(jìn)一步接觸,擴(kuò)充數(shù)據(jù)容量,完善數(shù)據(jù)規(guī)范,致力于推動(dòng)后續(xù)的產(chǎn)品和服務(wù)部署,推動(dòng)信息無障礙建設(shè)。
(優(yōu)圖和深圳信息無障礙研究會(huì)AI聽障無障礙聯(lián)合項(xiàng)目組)
此次的數(shù)字生態(tài)大會(huì)展示的優(yōu)圖AI手語翻譯機(jī),并不是騰訊在信息無障礙建設(shè)上的首次嘗試。早在2009年騰訊便開始了信息無障礙方面的探索,截至目前,旗下QQ、QQ空間、微信、騰訊網(wǎng)、騰訊新聞、應(yīng)用寶、企鵝FM等大部分產(chǎn)品已針對障礙用戶實(shí)現(xiàn)專門優(yōu)化,致力于為障礙人士構(gòu)建信息友好社會(huì)。2013年,騰訊優(yōu)圖團(tuán)隊(duì)和手機(jī)QQ一起打磨了OCR引擎技術(shù),基于計(jì)算機(jī)視覺算法及自然語言處理能力,可將圖片上的文字直接轉(zhuǎn)換為可編輯的結(jié)構(gòu)化文本,幫助視障群體實(shí)現(xiàn)信息溝通無障礙化。
與本次亮相數(shù)字生態(tài)大會(huì)AI分論壇的跨年齡人臉識別技術(shù)一樣,優(yōu)圖AI手語翻譯機(jī)同樣是騰訊踐行“科技向善”的重要體現(xiàn)。而優(yōu)圖實(shí)驗(yàn)室也將繼續(xù)秉承“科技向善”這一理念,推動(dòng)前沿技術(shù)在社會(huì)場景中的應(yīng)用,切實(shí)讓更多的實(shí)際問題得以解決。做有溫度的AI,讓科技產(chǎn)生更大的社會(huì)價(jià)值。
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會(huì)能源投資專業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,
個(gè)人創(chuàng)業(yè)需要啟動(dòng)成本低、無需龐大團(tuán)隊(duì)、可快速驗(yàn)證、能利用個(gè)人技能或資源。這里分享適合個(gè)人創(chuàng)業(yè)的十個(gè)機(jī)會(huì)一.AI內(nèi)容優(yōu)化與本地化服務(wù)·做什么:幫助企業(yè)或個(gè)人利用AI工具(如GPT-4,Midjourney)優(yōu)化內(nèi)容生產(chǎn)流程。例如,為跨境電商撰寫多語言產(chǎn)品描述,為小紅書博主生成爆款文案,為小公司制作營銷
文/道哥美國設(shè)計(jì)軟件公司Figma近期在紐約證券交易所掛牌上市,首日即上演“狂飆”行情——發(fā)行價(jià)定每股33美元,開盤報(bào)價(jià)85美元,較發(fā)行價(jià)翻倍。首日收報(bào)115.50美元,較發(fā)行價(jià)大漲約250%,市值飆升至近670億美元,創(chuàng)下近30年來同等規(guī)模美股IPO的最大單日漲幅紀(jì)錄。然而,隨著短線資金獲利了結(jié),
文/一燈來源/節(jié)點(diǎn)財(cái)經(jīng)在當(dāng)前無人敢缺席的AI軍備競賽中,巨頭們一面為巨額的資本支出焦慮,一面又向市場勾勒著未來的宏偉藍(lán)圖。在各家動(dòng)輒千億級投入的背景下,市場迫切需要一份關(guān)于AI回報(bào)價(jià)值的有力證明。而騰訊,率先給出了答卷。8月13日,騰訊控股發(fā)布2025年第二季度財(cái)報(bào)。盡管資本開支同比劇增119%,達(dá)
文/二風(fēng)來源/節(jié)點(diǎn)財(cái)經(jīng)2025年的硅谷,一場沒有硝煙的戰(zhàn)爭正以前所未有的烈度上演。這場戰(zhàn)爭的核心武器不是代碼或芯片,而是人——那些全球僅有數(shù)千名、能夠構(gòu)建未來人工智能基礎(chǔ)模型的頂尖大腦。在這場激烈的人才爭奪戰(zhàn)中,Meta及其首席執(zhí)行官馬克·扎克伯格(MarkZuckerberg)正扮演著最具侵略性的
AI的“免費(fèi)紅利期”結(jié)束了,未來18個(gè)月,靠“API倒賣”的公司,會(huì)成片消失。這個(gè)導(dǎo)火索就是最近Google的一輪封號導(dǎo)致的,隨著封號風(fēng)波的結(jié)束,這也標(biāo)志著AI行業(yè)【收租時(shí)代】來了。2月封號潮:高付費(fèi)用戶被一鍋端一周前,Google開始大規(guī)模封號,付著250美金月費(fèi)的人,賬號說沒就沒,Gmail、Y
來自路透社等媒體報(bào)道的最新消息:DeepSeek未發(fā)布的V4Lite模型遭泄露上網(wǎng),華為獲得早期訪問權(quán)限,英偉達(dá)被排除在外。近期,谷歌發(fā)表了2篇Multi-Agent協(xié)作學(xué)習(xí)新論文有網(wǎng)友提供了更加詳細(xì)的信息,DeepSeekV4Lite:100萬token上下文窗口(V3為128K)內(nèi)置原生多模態(tài)推
春節(jié)紅包會(huì)結(jié)束,但AI已融入數(shù)億人生活里
性能、商業(yè)、生態(tài)詮釋開源模型的最佳姿態(tài)
2026年剛開年,全世界最狂的那個(gè)男人,穿著他的經(jīng)典黑皮衣,在CES舞臺(tái)上發(fā)出了未來十年的信號。他搞了個(gè)“能吃飽套餐”:6個(gè)包子+一碟小菜+一碗粥=肉包子套餐,這樣以后你只要買一個(gè)套餐就能吃飽了。(Rubin平臺(tái))同時(shí)他們店里還免費(fèi)提供的筷子、勺子、蘸料、醬油、醋、水果、零食等等。(開放10萬億語言
12月12日-14日,2025全球開發(fā)者先鋒大會(huì)暨國際具身智能技能大賽(GDPS2025)于上海張江科學(xué)會(huì)堂舉行,大會(huì)以具身智能競技為核心,融合了技術(shù)比拼、產(chǎn)業(yè)展示與科普體驗(yàn),為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來。上海開普勒機(jī)器人有限公司(以下簡稱"開普勒機(jī)器人")攜明星產(chǎn)品K2"大黃蜂"亮相,并參
在數(shù)字化與智能化深度交織的時(shí)代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動(dòng)Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會(huì)在北京盛大召開。來自國家部委、院士學(xué)者、高??蒲袡C(jī)構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)
2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會(huì)能源投資專業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,
我覺得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國產(chǎn)開車26年國產(chǎn)芯片會(huì)在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會(huì)以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就