99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于 MediaPipe 的手語(yǔ)接口現(xiàn)對(duì)開(kāi)發(fā)者開(kāi)放

Tensorflowers ? 來(lái)源:TensorFlow ? 作者:TensorFlow ? 2021-06-08 18:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

客座博文,發(fā)布人:SignAll | MediaPipe 團(tuán)隊(duì)

請(qǐng)注意,以下內(nèi)容中體現(xiàn)的信息、用途及應(yīng)用完全是 SignAll 客座作者的觀點(diǎn)。

SignAll SDK:使用 MediaPipe 的手語(yǔ)接口現(xiàn)對(duì)開(kāi)發(fā)者開(kāi)放

當(dāng) Google 發(fā)布第一個(gè)基于 MediaPipe 的設(shè)備端手部追蹤技術(shù)時(shí),它便成為了開(kāi)發(fā)者構(gòu)建手語(yǔ)識(shí)別解決方案應(yīng)用的基礎(chǔ)。Google 之后對(duì)這個(gè)手部跟蹤解決方案的進(jìn)一步更新,將其準(zhǔn)確率提升至其他技術(shù)所無(wú)法達(dá)到的水平。

SignAll 是一家研發(fā)手語(yǔ)翻譯技術(shù)的初創(chuàng)公司,致力于為失聰人士普及手語(yǔ)翻譯,讓他們能夠與聽(tīng)力正常的人群以及計(jì)算機(jī)進(jìn)行交流。SignAll 的產(chǎn)品采用了復(fù)雜的多攝像頭設(shè)置和帶有彩色標(biāo)記的手套,廣泛用于美國(guó)的通信和教育領(lǐng)域。

雖然手語(yǔ)的復(fù)雜性不僅限于手形(還包括面部特征、肢體、語(yǔ)法等),但準(zhǔn)確追蹤手部確實(shí)已經(jīng)給預(yù)處理程序(即計(jì)算機(jī)視覺(jué))造成了巨大阻礙。MediaPipe 為 SignAll 的解決方案提供了更多可能性,不僅能夠免除手套,還可以使用單攝像頭設(shè)置。SignAll 已經(jīng)宣布針對(duì)此類型開(kāi)放首版 SDK,所以開(kāi)發(fā)者現(xiàn)在能夠在自己的應(yīng)用中啟用手語(yǔ)輸入。

SignAll

https://www.signall.us/

開(kāi)放首版 SDK

https://signall.us/sdk

近期,該公司在 App Store 上發(fā)布了一個(gè)互動(dòng)式教育應(yīng)用,該應(yīng)用可以讓用戶通過(guò)即時(shí)反饋來(lái)練習(xí)手語(yǔ),還能夠展現(xiàn)出 SDK 的潛力。

SignAll 與 MediaPipe Hands

我們的系統(tǒng)在手語(yǔ)識(shí)別方面采用多個(gè)數(shù)據(jù)層,各層數(shù)據(jù)的抽象性越來(lái)越高。低級(jí)數(shù)據(jù)層從 2D 和 3D 攝像頭中提取關(guān)鍵的手部、軀體和面部數(shù)據(jù)。在我們的第一個(gè)實(shí)現(xiàn)中,此數(shù)據(jù)層會(huì)檢測(cè)手套的顏色,并創(chuàng)建 3D 手部數(shù)據(jù)。將其替換為 MediaPipe Hands(MediaPipe Pose 和 MediaPipe Face Mesh 作為補(bǔ)充)具有顛覆性的重要意義,因?yàn)槟悴辉傩枰痔谆蛱厥夤饩€來(lái)使用我們的系統(tǒng)。

MediaPipe Hands

https://google.github.io/mediapipe/solutions/hands.html

MediaPipe Pose

https://google.github.io/mediapipe/solutions/pose.html

MediaPipe Face Mesh

https://google.github.io/mediapipe/solutions/face_mesh.html

如上文所述,我們使用了多個(gè)帶有深度傳感器的攝像頭,并在實(shí)際中對(duì)這些傳感器進(jìn)行了校準(zhǔn)。相較于本地?cái)z像頭或張量空間,這種方法能夠?qū)崿F(xiàn)更加準(zhǔn)確的 3D 世界空間探測(cè),但每個(gè)攝像頭都需要進(jìn)行手部特征點(diǎn)檢測(cè)。攝像頭的位置和屏幕方向各不相同,因此可以實(shí)現(xiàn)更高的手部可視頻率,因?yàn)閺囊粋€(gè)攝像頭的角度來(lái)看,手部可能會(huì)被另外一只手遮擋,但從另一個(gè)攝像頭的角度來(lái)看,可能并不存在遮擋。

接下來(lái)的步驟是過(guò)濾數(shù)據(jù),并進(jìn)行數(shù)據(jù)平滑處理,以復(fù)制彩色手套標(biāo)記提供的精確測(cè)量值。雖然 SignAll 的標(biāo)記與 MediaPipe 提供的界標(biāo)不同,但我們使用了手部模型并根據(jù)界標(biāo)生成彩色標(biāo)記。因此,新的動(dòng)作捕捉數(shù)據(jù)與之前的數(shù)據(jù)完全兼容。

雖然我們主要關(guān)注手部,但我們同時(shí)整合了 MediaPipe Pose 和 MediaPipe Face Mesh。即便在彼此接觸,或距離很近的情況下,姿態(tài)界標(biāo)都能提供準(zhǔn)確的手部姿態(tài)信息。

雖然這兩個(gè)版本的動(dòng)作捕捉是兼容的,但工件的性質(zhì)不同:一種是直接測(cè)量各個(gè)標(biāo)記,另一種是根據(jù)全局檢測(cè)的手部模擬標(biāo)記。因?yàn)榇嬖诓町悾晕覀儽仨氃诟邔蛹?jí)對(duì)參數(shù)進(jìn)行優(yōu)化。另一方面,我們?nèi)钥梢岳梦覀兊拇笮褪终Z(yǔ)數(shù)據(jù)庫(kù)來(lái)進(jìn)行無(wú)手套配置。我們可以通過(guò)替換低級(jí)數(shù)據(jù),優(yōu)化高級(jí)數(shù)據(jù),以無(wú)手套形式測(cè)試我們的系統(tǒng)。實(shí)現(xiàn)無(wú)手套化,對(duì)于手語(yǔ)識(shí)別技術(shù)的全球推廣具有重要意義。

使用 MediaPipe 框架的 SignAll 系統(tǒng)

將 MediaPipe Hands 整合至系統(tǒng)后,我們還希望能夠利用 MediaPipe 框架在多個(gè)平臺(tái)上提供的自定義和擴(kuò)容機(jī)會(huì)。這樣我們不僅可以用 Python 原型化我們的狀態(tài)研究方法,而且還可以為 Windows、iOS、Android 甚至 Web 提供最終用戶解決方案。

由于我們的模塊圖系統(tǒng)和 MediaPipe 的計(jì)算圖之間具有相似性,現(xiàn)有的處理單元只需稍作修改就可以在這個(gè)新框架中重用。盡管如此,擴(kuò)展平臺(tái)組還面臨著其他挑戰(zhàn),例如在大多數(shù)情況下我們只能使用單個(gè) 2D 攝像頭而不是經(jīng)過(guò)校準(zhǔn)的多攝像頭系統(tǒng)。

我們開(kāi)發(fā)并使用的模型、算法和技術(shù),主要是為了在 3D 全局世界中處理動(dòng)作捕捉數(shù)據(jù)。毫無(wú)疑問(wèn),從單攝像頭設(shè)置中提取的數(shù)據(jù)達(dá)不到同樣的詳細(xì)程度。所以我們必須對(duì)實(shí)現(xiàn)進(jìn)行一些調(diào)整,微調(diào)算法并添加一些額外邏輯(例如,動(dòng)態(tài)適應(yīng)手持?jǐn)z像頭用例導(dǎo)致的空間變化)。幸運(yùn)的是,MediaPipe 框架讓我們能夠用 C ++ 實(shí)現(xiàn)核心處理單元,因此我們?nèi)匀豢梢詮南惹伴_(kāi)發(fā)的運(yùn)行時(shí)優(yōu)化核心解決方案中受益。

為了更好地處理來(lái)自單個(gè) 2D 源的數(shù)據(jù),一些基于 3D 數(shù)據(jù)訓(xùn)練的高級(jí)模型需要重新訓(xùn)練。MediaPipe 界標(biāo)由 3D 坐標(biāo)定義,因此可以重復(fù)使用現(xiàn)有的訓(xùn)練方法和概念。另一方面,2D 信息的提取比三維坐標(biāo)更為直接也更為穩(wěn)定,在修改設(shè)計(jì)訓(xùn)練時(shí)需要考慮到這一點(diǎn)。

幸運(yùn)的是,我們無(wú)需為實(shí)現(xiàn)此目標(biāo)而進(jìn)行全新的數(shù)據(jù)記錄。我們?nèi)匀豢梢允褂米⑨屧敿?xì)的大型視頻數(shù)據(jù)庫(kù)。預(yù)處理的動(dòng)作捕捉數(shù)據(jù)可以從我們的記錄中提取,并在 3D 世界中解釋,從而用來(lái)模擬任何虛擬攝像頭視圖中的手部、骨架或面部界標(biāo)檢測(cè)。

在虛擬攝像頭視圖的數(shù)據(jù)中,我們同時(shí)使用傳統(tǒng)的 2D 記錄,以足夠的比例覆蓋界標(biāo)檢測(cè)的獨(dú)特噪點(diǎn)特征。由于大多數(shù)此類數(shù)據(jù)已經(jīng)提前收集了,所以我們可以專注于嘗試最新技術(shù)并訓(xùn)練新模型。

總結(jié)

在 MediaPipe 助力的改進(jìn),讓 SignAll 可以更改其模型。除了提供用于手語(yǔ)教學(xué)和翻譯的多合一產(chǎn)品之外,SignAll 現(xiàn)在也開(kāi)始提供面向開(kāi)發(fā)者的 SDK。此 SDK 的功能取決于攝像頭的類型和可用的算力。SDK 可以啟用的功能包括:

面向開(kāi)發(fā)者的 SDK

https://signall.us/sdk

通過(guò)用手語(yǔ)表示聯(lián)系人的姓名來(lái)發(fā)起視頻通話

通過(guò)手語(yǔ)(與語(yǔ)音輸入相對(duì)應(yīng))在導(dǎo)航中添加地址,或在快餐店的信息亭或直通車道中進(jìn)行點(diǎn)餐。

SignAll 的使命是讓手語(yǔ)能夠全方位替代語(yǔ)音,而我們非常高興看到越來(lái)越多的應(yīng)用實(shí)現(xiàn)了此功能。

我們十分期待 MediaPipe 未來(lái)的更新,這些更新能夠幫助我們進(jìn)一步實(shí)現(xiàn)終極目標(biāo)——讓所有人在任何設(shè)備上都能使用我們的解決方案。最值得期待的更新是能夠建立自定義的 MediaPipe 圖,并添加我們自己的計(jì)算器,從而在 WebAssembly 技術(shù)的輔助下實(shí)現(xiàn)基于網(wǎng)絡(luò)的解決方案,這樣網(wǎng)站就能夠?yàn)槭斣L問(wèn)者提供全新水平的無(wú)障礙功能。

TensorFlow

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2959

    瀏覽量

    110727
  • C++
    C++
    +關(guān)注

    關(guān)注

    22

    文章

    2119

    瀏覽量

    75271
  • SDK
    SDK
    +關(guān)注

    關(guān)注

    3

    文章

    1077

    瀏覽量

    49059

原文標(biāo)題:SignAll SDK:基于 MediaPipe 的手語(yǔ)接口現(xiàn)對(duì)開(kāi)發(fā)者開(kāi)放

文章出處:【微信號(hào):tensorflowers,微信公眾號(hào):Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    芯科科技亮相2025 Matter開(kāi)放日和開(kāi)發(fā)者大會(huì)

    2025年Matter開(kāi)放日(MOD)和開(kāi)發(fā)者大會(huì)(MDC)在上周6月12-13日?qǐng)A滿成功舉辦,Silicon Labs(芯科科技)延續(xù)一直以來(lái)傾力支持Matter標(biāo)準(zhǔn)發(fā)展的策略,攜Matter最新演示與參考應(yīng)用再次亮相今年的Matter
    的頭像 發(fā)表于 06-18 14:22 ?436次閱讀

    層層剝開(kāi)開(kāi)鴻Bot,我們看到的是“開(kāi)發(fā)者優(yōu)先”

    對(duì)開(kāi)源生態(tài)來(lái)說(shuō),社區(qū)先于代碼,開(kāi)發(fā)者重于一切
    的頭像 發(fā)表于 05-27 09:23 ?2342次閱讀
    層層剝開(kāi)開(kāi)鴻Bot,我們看到的是“<b class='flag-5'>開(kāi)發(fā)者</b>優(yōu)先”

    榮膺多項(xiàng)殊榮!軟通動(dòng)力攜子公司鴻湖萬(wàn)聯(lián)亮相2024開(kāi)放原子開(kāi)發(fā)者大會(huì)

    12月20日至21日,由開(kāi)放原子開(kāi)源基金會(huì)、中國(guó)通信學(xué)會(huì)主辦的2024開(kāi)放原子開(kāi)發(fā)者大會(huì)暨首屆開(kāi)源技術(shù)學(xué)術(shù)大會(huì)在武漢盛大召開(kāi)。大會(huì)以“一切為了開(kāi)發(fā)者”為主題,旨在貫徹落實(shí)國(guó)家軟件發(fā)展戰(zhàn)
    的頭像 發(fā)表于 01-20 09:42 ?816次閱讀
    榮膺多項(xiàng)殊榮!軟通動(dòng)力攜子公司鴻湖萬(wàn)聯(lián)亮相2024<b class='flag-5'>開(kāi)放</b>原子<b class='flag-5'>開(kāi)發(fā)者</b>大會(huì)

    開(kāi)發(fā)者的開(kāi)源鴻蒙故事

    近日,在以“一切為了開(kāi)發(fā)者”為主題的“2024開(kāi)放原子開(kāi)發(fā)者大會(huì)暨首屆開(kāi)源技術(shù)學(xué)術(shù)大會(huì)”上,開(kāi)源鴻蒙5.0 Release版本正式發(fā)布,備受各方關(guān)注。該版本在系統(tǒng)完備度、分布式創(chuàng)新、開(kāi)發(fā)者
    的頭像 發(fā)表于 01-06 10:28 ?860次閱讀

    普華基礎(chǔ)軟件亮相2024開(kāi)放原子開(kāi)發(fā)者大會(huì)

    近日,以“一切為了開(kāi)發(fā)者”為主題的“2024開(kāi)放原子開(kāi)發(fā)者大會(huì)暨首屆開(kāi)源技術(shù)學(xué)術(shù)大會(huì)”在武漢舉辦。普華基礎(chǔ)軟件作為開(kāi)放原子開(kāi)源基金會(huì)開(kāi)源生態(tài)合作伙伴,受邀參加開(kāi)源微內(nèi)核龘(EasyAd
    的頭像 發(fā)表于 12-24 14:32 ?653次閱讀

    潤(rùn)和軟件亮相2024開(kāi)放原子開(kāi)發(fā)者大會(huì)

    近日,2024開(kāi)放原子開(kāi)發(fā)者大會(huì)暨首屆開(kāi)源技術(shù)學(xué)術(shù)大會(huì)在武漢圓滿召開(kāi)。大會(huì)由開(kāi)放原子開(kāi)源基金會(huì)、中國(guó)通信學(xué)會(huì)主辦,旨在貫徹落實(shí)國(guó)家軟件發(fā)展戰(zhàn)略,加速培育壯大我國(guó)開(kāi)源生態(tài)。
    的頭像 發(fā)表于 12-24 10:49 ?558次閱讀

    DFRobot參加2024開(kāi)放原子開(kāi)發(fā)者大會(huì)及開(kāi)放原子開(kāi)放硬件許可證發(fā)布儀式

    12月20日至21日,2024開(kāi)放原子開(kāi)發(fā)者大會(huì)暨首屆開(kāi)源技術(shù)學(xué)術(shù)大會(huì)在湖北省武漢市東湖新技術(shù)開(kāi)發(fā)區(qū)的光谷希爾頓酒店隆重舉行。此次大會(huì)以“一切為了開(kāi)發(fā)者”為主題,旨在匯聚行業(yè)精英,共同
    的頭像 發(fā)表于 12-23 16:21 ?694次閱讀
    DFRobot參加2024<b class='flag-5'>開(kāi)放</b>原子<b class='flag-5'>開(kāi)發(fā)者</b>大會(huì)及<b class='flag-5'>開(kāi)放</b>原子<b class='flag-5'>開(kāi)放</b>硬件許可證發(fā)布儀式

    2024開(kāi)放原子開(kāi)發(fā)者大會(huì)精彩回顧

    近日,以“一切為了開(kāi)發(fā)者”為主題的“2024開(kāi)放原子開(kāi)發(fā)者大會(huì)暨首屆開(kāi)源技術(shù)學(xué)術(shù)大會(huì)”在湖北武漢舉辦。本屆大會(huì)由開(kāi)放原子開(kāi)源基金會(huì)、中國(guó)通信學(xué)會(huì)聯(lián)合主辦,主要包括“六會(huì)”“兩賽”“一秀
    的頭像 發(fā)表于 12-23 15:50 ?544次閱讀

    2024開(kāi)放原子開(kāi)發(fā)者大會(huì)暨首屆開(kāi)源技術(shù)學(xué)術(shù)大會(huì)成功舉辦

    近日,以“一切為了開(kāi)發(fā)者”為主題的2024開(kāi)放原子開(kāi)發(fā)者大會(huì)暨首屆開(kāi)源技術(shù)學(xué)術(shù)大會(huì)在武漢成功舉辦。大會(huì)為眾多開(kāi)源項(xiàng)目和開(kāi)發(fā)者提供了廣闊的展示空間,為繁榮開(kāi)源生態(tài)注入了強(qiáng)勁動(dòng)力。與會(huì)
    的頭像 發(fā)表于 12-23 14:23 ?550次閱讀

    軟通動(dòng)力與鴻湖萬(wàn)聯(lián)亮相2024開(kāi)放原子開(kāi)發(fā)者大會(huì)

    12月20日至21日,由開(kāi)放原子開(kāi)源基金會(huì)、中國(guó)通信學(xué)會(huì)主辦的2024開(kāi)放原子開(kāi)發(fā)者大會(huì)暨首屆開(kāi)源技術(shù)學(xué)術(shù)大會(huì)在武漢盛大召開(kāi)。大會(huì)以“一切為了開(kāi)發(fā)者”為主題,旨在貫徹落實(shí)國(guó)家軟件發(fā)展戰(zhàn)
    的頭像 發(fā)表于 12-23 13:53 ?514次閱讀

    2024年度國(guó)內(nèi)活躍開(kāi)源項(xiàng)目和開(kāi)發(fā)者在武漢揭曉

    近日,2024年度國(guó)內(nèi)活躍開(kāi)源項(xiàng)目&開(kāi)發(fā)者致謝儀式,亮相2024開(kāi)放原子開(kāi)發(fā)者大會(huì)暨首屆開(kāi)源技術(shù)學(xué)術(shù)大會(huì)開(kāi)幕式。
    的頭像 發(fā)表于 12-23 11:25 ?623次閱讀

    2024開(kāi)放原子開(kāi)發(fā)者大會(huì)啟幕,深開(kāi)鴻助力開(kāi)源產(chǎn)業(yè)創(chuàng)新發(fā)展

    12月20日-21日,以“一切為了開(kāi)發(fā)者”為主題的“2024開(kāi)放原子開(kāi)發(fā)者大會(huì)暨首屆開(kāi)源技術(shù)學(xué)術(shù)大會(huì)”在武漢隆重召開(kāi)。本屆大會(huì)由開(kāi)放原子開(kāi)源基金會(huì)、中國(guó)通信學(xué)會(huì)主辦,旨在貫徹落實(shí)國(guó)家軟
    的頭像 發(fā)表于 12-20 18:34 ?509次閱讀
    2024<b class='flag-5'>開(kāi)放</b>原子<b class='flag-5'>開(kāi)發(fā)者</b>大會(huì)啟幕,深開(kāi)鴻助力開(kāi)源產(chǎn)業(yè)創(chuàng)新發(fā)展

    KaihongOS 4.1.2開(kāi)發(fā)者預(yù)覽版正式上線,誠(chéng)邀開(kāi)發(fā)者免費(fèi)試用!

    深開(kāi)鴻在2024開(kāi)放原子開(kāi)源生態(tài)大會(huì)上正式宣布KaihongOS4.1.2開(kāi)發(fā)者預(yù)覽版全面上線,并向全球開(kāi)發(fā)者開(kāi)放免費(fèi)下載。作為KaihongOS不斷創(chuàng)新與發(fā)展的重要里程碑,此次預(yù)覽版
    的頭像 發(fā)表于 09-28 08:07 ?729次閱讀
    KaihongOS 4.1.2<b class='flag-5'>開(kāi)發(fā)者</b>預(yù)覽版正式上線,誠(chéng)邀<b class='flag-5'>開(kāi)發(fā)者</b>免費(fèi)試用!

    KaihongOS 4.1.2開(kāi)發(fā)者預(yù)覽版正式上線,誠(chéng)邀開(kāi)發(fā)者免費(fèi)試用!

    今日,深開(kāi)鴻在2024開(kāi)放原子開(kāi)源生態(tài)大會(huì)上正式宣布KaihongOS 4.1.2開(kāi)發(fā)者預(yù)覽版全面上線,并向全球開(kāi)發(fā)者開(kāi)放免費(fèi)下載。作為KaihongOS不斷創(chuàng)新與發(fā)展的重要里程碑,此
    的頭像 發(fā)表于 09-26 15:59 ?743次閱讀

    開(kāi)發(fā)者空間實(shí)踐指導(dǎo):基于 3 大 PaaS 主流服務(wù)輕松實(shí)現(xiàn)文字轉(zhuǎn)換語(yǔ)音

    【摘要】 基于 CodeArts API 設(shè)計(jì)語(yǔ)音合成接口,基于 API Explorer 調(diào)試接口,并利用 CodeArts IDE 實(shí)現(xiàn)數(shù)據(jù)流轉(zhuǎn)換為音頻 案例簡(jiǎn)介 開(kāi)發(fā)者將在云主機(jī)中
    的頭像 發(fā)表于 09-13 16:25 ?745次閱讀
    <b class='flag-5'>開(kāi)發(fā)者</b>空間實(shí)踐指導(dǎo):基于 3 大 PaaS 主流服務(wù)輕松實(shí)現(xiàn)文字轉(zhuǎn)換語(yǔ)音