99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聚焦語音 AI:在 AR 眼鏡上可視化語音和聲音

NVIDIA英偉達(dá) ? 來源:未知 ? 2023-07-26 19:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

音頻可以包含從人類語言到非語言聲音等各種聲音,例如狗吠和警笛聲。在為聽力困難的人設(shè)計無障礙應(yīng)用程序時,該應(yīng)用程序應(yīng)能夠識別聲音并理解語義。

這種技術(shù)將有助于聾啞或聽力有障礙的人可視化語音,例如人類的對話和非語音聲音。通過將語音和聲音 AI 相結(jié)合,可以將這些可視化效果疊加到 AR 眼鏡上,從而使用戶能夠看到并理解他們無法聽到的聲音。

根據(jù)世界衛(wèi)生組織的統(tǒng)計,約有 15 億人(占全球人口近 20%)患有聽力損失。到 2050 年,這一數(shù)字將上升至 25 億。

Cochl 是 NVIDIA 的合作伙伴,總部位于圣何塞。該公司是一家利用聲音 AI 技術(shù)來理解各類音頻的科技密集型初創(chuàng)企業(yè)。他同時也是 NVIDIA 初創(chuàng)加速計劃的會員。通過提供尖端技術(shù)和 NVIDIA 專家的支持,該計劃幫助初創(chuàng)企業(yè)更快地構(gòu)建解決方案。

該平臺可識別 37 種環(huán)境聲音,并且 CochI 還加入了先進(jìn)的語音轉(zhuǎn)文本技術(shù),使用戶能夠真正全方位地了解聲音世界。

AR 眼鏡可視化任何聲音

AR 眼鏡作為一個可視化聲音的工具,有望極大改善聽力損失者的生活。這項技術(shù)可以幫助提高他們的交流能力,使他們更容易理解和融入到周圍的世界。

Cochl.Sense 和 NVIDIA Riva 在微軟 HoloLens 2 上運行!

在此方案中,自動語音識別(ASR)使眼鏡能夠識別并理解人類的語音。這項技術(shù)可通過多種方式集成到眼鏡中:

  • 使用麥克風(fēng)捕捉與聾啞人或聽力有障礙者交談的人的語音,然后使用 ASR 算法解釋語音并將其轉(zhuǎn)錄為文本,最后將該文本顯示在眼鏡上,從而使聾啞人或聽力有障礙者能夠閱讀并理解該語音。

  • ASR 還可以使眼鏡能夠響應(yīng)語音命令,以便用戶可以通過語音控制眼鏡。

  • AR 眼鏡還能在屏幕上顯示所有對話(例如在駕車時轉(zhuǎn)錄地圖上的語音指示)以及其他聲音(例如緊急車輛的喇叭聲、警報聲以及風(fēng)聲)。

解決方案背后的技術(shù)

Cochl 在其軟件堆棧中使用了 NVIDIA Riva 來增強(qiáng)其 ASR 功能。Riva 是一個使用 GPU 加速、完全可定制的 SDK,用于開發(fā)語音 AI 的應(yīng)用程序。通過使用 Riva,該平臺的功能得以擴(kuò)展,能夠理解包括非語音聲音在內(nèi)的各種聲音。

Cochl 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Yoonchang Han 表示:“我們測試了很多語音識別服務(wù),但只有 Riva 提供了極高且穩(wěn)定的實時性能。所以現(xiàn)在我們可以讓我們的聲音 AI 系統(tǒng)更加接近人類的聽覺感知?!?/p>

“正如我們所觀察到的,AR 眼鏡最有可能在環(huán)境嘈雜的開放空間中使用。NVIDIA Riva 幫助我們在嘈雜的環(huán)境中也能準(zhǔn)確轉(zhuǎn)錄語音,并為我們提供了無縫體驗,可以集成到我們的 Cochl.Sense 平臺上。”

輔助技術(shù)的未來

創(chuàng)建一個能像人類一樣感知聲音的通用 AI 系統(tǒng)是一項巨大的挑戰(zhàn)。為了使 AR 眼鏡更易于使用,需要更輕便的可穿戴技術(shù)。

盡管它們?nèi)匀皇菍⒙曇艉驼Z音轉(zhuǎn)化為視覺信息的理想媒介。通過集成機(jī)器聽覺功能,AR 眼鏡能夠為世界各地的聾啞或聽力障礙者帶來更加安全、便捷和愉快的日常生活體驗。

Cochl 還在探索語音 AI 的更多用例,例如為 AR 眼鏡上的任何視頻提供隱藏式字幕和實現(xiàn)多個發(fā)言者的轉(zhuǎn)錄。為了給聽力障礙者帶來最佳體驗,該公司正在探索分析并可視化音樂的方法,以幫助他們至少能夠理解音樂的類型和情感。

該公司期待體驗更多的 NVIDIA 解決方案,包括 Riva、NVIDIA NeMo 和 NVIDIA TensorRT。

點擊“閱讀原文”,或掃描下方海報二維碼,在 8 月 8日聆聽NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 SIGGRAPH 現(xiàn)場發(fā)表的 NVIDIA 主題演講,了解 NVIDIA 的新技術(shù),包括屢獲殊榮的研究,OpenUSD 開發(fā),以及最新的 AI 內(nèi)容創(chuàng)作解決方案。


原文標(biāo)題:聚焦語音 AI:在 AR 眼鏡上可視化語音和聲音

文章出處:【微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3948

    瀏覽量

    93687

原文標(biāo)題:聚焦語音 AI:在 AR 眼鏡上可視化語音和聲音

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    成都匯陽投資關(guān)于芯片+AI 眼鏡核心公司

    視覺圖像, 實現(xiàn)流暢交互體驗。其低功耗特性也至關(guān)重要, 可延長 AI 眼鏡續(xù)航, 保障長時間使用。市場中一些公司同時布局芯片與 AI 眼鏡領(lǐng)域。它們能依據(jù)
    的頭像 發(fā)表于 07-01 09:28 ?195次閱讀

    結(jié)構(gòu)可視化:利用數(shù)據(jù)編輯器剖析數(shù)據(jù)內(nèi)在架構(gòu)?

    結(jié)構(gòu)可視化聚焦于展示數(shù)據(jù)的內(nèi)部結(jié)構(gòu)和各部分之間的關(guān)系,使企業(yè)能夠深入理解數(shù)據(jù)的組織方式和層次體系,從而更好地進(jìn)行數(shù)據(jù)管理和分析。通過結(jié)構(gòu)可視化,企業(yè)可以清晰地看到數(shù)據(jù)的層次結(jié)構(gòu)、關(guān)聯(lián)關(guān)系以及數(shù)據(jù)流
    的頭像 發(fā)表于 05-07 18:42 ?203次閱讀

    VirtualLab Fusion應(yīng)用:3D系統(tǒng)可視化

    描述和F-Theta透鏡的應(yīng)用示例。 光學(xué)系統(tǒng)的3D-可視化 VirtualLab Fusion提供的工具可以實現(xiàn)光學(xué)系統(tǒng)的3D可視化,因此可以用于檢查元件的位置,以及快速了解系統(tǒng)內(nèi)部的光傳播情況
    發(fā)表于 04-30 08:47

    可視化組態(tài)物聯(lián)網(wǎng)平臺是什么

    可視化組態(tài)物聯(lián)網(wǎng)平臺是物聯(lián)網(wǎng)技術(shù)與組態(tài)技術(shù)相結(jié)合的產(chǎn)物,是通過提供豐富的圖形組件和可視化元素,讓用戶能夠以直觀、便捷的方式對物聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行監(jiān)控、分析和管理的平臺。以下是其具體介紹: 定義 組態(tài)
    的頭像 發(fā)表于 04-21 10:40 ?287次閱讀

    谷東AR+AI智能眼鏡如何改變生活

    這不是科幻電影,而是一副AR+AI眼鏡正在發(fā)生的“魔法”。今天,我們帶大家走進(jìn)這款即將改變生活的未來科技——谷東AR+AI智能眼鏡。
    的頭像 發(fā)表于 04-14 12:50 ?579次閱讀

    智能眼鏡AI需求倒逼芯片革命,看高通、ST芯片方案如何適配

    但不限于語音識別與控制、實時翻譯、圖像識別與增強(qiáng)現(xiàn)實(AR)等。為了支持上述高級功能,智能眼鏡對其主控芯片提出了更高的要求。 ? ? 智能眼鏡AI
    的頭像 發(fā)表于 04-12 00:54 ?3074次閱讀
    智能<b class='flag-5'>眼鏡</b><b class='flag-5'>AI</b>需求倒逼芯片革命,看高通、ST芯片方案如何適配

    VirtualLab Fusion中的可視化設(shè)置

    摘要 VirtualLab Fusion中的全局選項對話框可以輕松定制軟件的外觀和感覺。還可以保存和加載全局選項文件,以便可以輕松地將偏好設(shè)置從一個設(shè)備轉(zhuǎn)移到另一個設(shè)備。本文檔說明了與可視化和結(jié)果
    發(fā)表于 02-25 08:51

    VirtualLab Fusion應(yīng)用:光波導(dǎo)k域布局可視化(“神奇的圓環(huán)”)

    ,光可以TIR(全反射)作用下傳播,并與光導(dǎo)表面上不同類型的光柵結(jié)構(gòu)相結(jié)合,以耦合光進(jìn)出。VirtualLab Fusion中,k-Layout可視化工具提供了一種k域中強(qiáng)大的圖
    發(fā)表于 02-21 08:53

    行業(yè)集結(jié):共同定制 RK3566 集成 AI 眼鏡的前沿 AR 方案

    服務(wù)器)· 視頻錄制和保存· 實時翻譯顯示· 藍(lán)牙播放(經(jīng)典藍(lán)牙 / LE audio/Auracast)· 語音喚醒 / 命令詞AI 眼鏡圖片 (不得轉(zhuǎn)載)關(guān)鍵優(yōu)勢RK3566如何點亮A
    發(fā)表于 02-20 18:44

    七款經(jīng)久不衰的數(shù)據(jù)可視化工具!

    。通過FineBI,企業(yè)能夠多維度、多場景下進(jìn)行靈活的數(shù)據(jù)分析,提升數(shù)據(jù)可視化效果,幫助決策者做出更加精準(zhǔn)的決策。
    發(fā)表于 01-19 15:24

    光學(xué)系統(tǒng)的3D可視化

    **摘要 ** 為了從根本上了解光學(xué)系統(tǒng)的特性,對其組件進(jìn)行可視化并顯示光的傳播情況大有幫助。為此,VirtualLab Fusion 提供了顯示光學(xué)系統(tǒng)三維可視化的工具。這些工具還可用于檢查元件
    發(fā)表于 01-06 08:53

    解鎖個性語音交互新時代:九芯智能語音云平臺,讓創(chuàng)意聲音觸手可及!

    九芯智能語音云平臺提供全面高效安全的智能語音服務(wù),支持自定義語音內(nèi)容,簡化燒錄流程,依托AI技術(shù),助力各行業(yè)智能升級,引領(lǐng)
    的頭像 發(fā)表于 01-02 16:51 ?887次閱讀
    解鎖個性<b class='flag-5'>化</b><b class='flag-5'>語音</b>交互新時代:九芯智能<b class='flag-5'>語音</b>云平臺,讓創(chuàng)意<b class='flag-5'>聲音</b>觸手可及!

    什么是大屏數(shù)據(jù)可視化?特點有哪些?

    大屏數(shù)據(jù)可視化是指通過大屏幕展示大量數(shù)據(jù)和信息,以直觀、可視化的方式幫助用戶理解和分析數(shù)據(jù)。這種展示方式通常用于展示復(fù)雜的數(shù)據(jù)集、實時監(jiān)控系統(tǒng)、企業(yè)管理儀表盤等。以下是關(guān)于 大屏數(shù)據(jù)可視化 的詳細(xì)
    的頭像 發(fā)表于 12-16 16:59 ?676次閱讀

    智慧能源可視化監(jiān)管平臺——助力可視化能源數(shù)據(jù)管理

    博達(dá)可視化大屏設(shè)計平臺智慧能源領(lǐng)域的價值體現(xiàn)在實時監(jiān)控、數(shù)據(jù)可視化、決策支持和效率提升等方面。借助該平臺,企業(yè)可以輕松搭建智慧能源類可視化大屏,更加精確和高效地管理生產(chǎn)和生活,實現(xiàn)能
    的頭像 發(fā)表于 11-29 10:00 ?944次閱讀
    智慧能源<b class='flag-5'>可視化</b>監(jiān)管平臺——助力<b class='flag-5'>可視化</b>能源數(shù)據(jù)管理

    智慧樓宇可視化的優(yōu)點

    智慧樓宇可視化是指通過數(shù)據(jù)可視化技術(shù)來展示和分析樓宇的各種數(shù)據(jù),為樓宇管理者和用戶提供直觀、清晰的信息展示和決策支持。以下是智慧樓宇可視化的優(yōu)點,詳細(xì)介紹其樓宇管理和運營中的重要作用
    的頭像 發(fā)表于 11-19 14:25 ?477次閱讀