99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Amazon Alexa如何工作?您的自然語言處理指南

電子設(shè)計 ? 來源:電子設(shè)計 ? 作者:電子設(shè)計 ? 2020-12-10 21:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我們現(xiàn)在可以與幾乎所有智能設(shè)備進行對話,但是它如何工作?當您問“這是什么歌?”時,正在使用什么技術(shù)?

Alexa如何運作?

根據(jù)Microsoft程序經(jīng)理Adi Agashe的說法,Alexa是基于自然語言處理(NLP)構(gòu)建的,該過程是將語音轉(zhuǎn)換為單詞,聲音和想法的過程。
亞馬遜會記錄您的話語。實際上,解釋聲音會占用大量計算能力,您的語音記錄會發(fā)送到Amazon的服務器以進行更有效的分析。

計算能力:指執(zhí)行指令的速度,通常以kiloflops,megaflops等表示。

亞馬遜將您的命令分解為單獨部分的聲音。然后,它查閱包含各個單詞的發(fā)音的數(shù)據(jù)庫,以找出最接近對應于各個聲音組合的單詞。

然后,它識別出重要的單詞以使任務有意義并執(zhí)行相應的功能。例如,如果Alexa注意到諸如“體育”或“籃球”之類的字詞,則會打開體育應用程序。

Amazon的服務器將信息發(fā)送回您的設(shè)備,Alexa可能會講話。如果Alexa需要說點什么,它將按照上述相同的過程進行,但是順序相反

深入的解釋

根據(jù)Trupti Behera的說法,“它始于信號處理,這為Alexa提供了盡可能多的機會通過清除信號來理解音頻。信號處理是遠場音頻中最重要的挑戰(zhàn)之一。

想法是改善目標信號,這意味著能夠識別電視等環(huán)境噪聲并將其最小化。為了解決這些問題,使用了七個麥克風來大致識別信號的來源,以便設(shè)備可以專注于此?;芈曄梢詼p去該信號,因此僅保留剩余的重要信號。

下一個任務是“喚醒字檢測”。它確定用戶是否說出設(shè)備被編程需要打開的單詞之一,例如“ Alexa”。需要這樣做以最大程度地減少誤報和誤報,這些誤報和誤報可能導致意外購買和引起客戶憤怒。這確實很復雜,因為它需要識別發(fā)音差異,并且需要在CPU能力有限的設(shè)備上進行識別。

如果檢測到喚醒字,則將信號發(fā)送到云中的語音識別軟件,該軟件將音頻和 將其轉(zhuǎn)換為文本格式。由于它查看英語中的所有單詞,因此輸出空間很大,并且云是唯一能夠充分擴展的技術(shù)。使用Echo播放音樂的人的數(shù)量使情況進一步復雜化-許多藝術(shù)家使用的名字拼寫方式不同于一般常見的單詞。

要將音頻轉(zhuǎn)換為文本,Alexa將分析用戶語音的特征(例如頻率和音高)以提供特征值。

給定輸入特征和模型,解碼器將確定最可能的單詞序列是什么,該模型分為兩部分。其中的第一個是先驗的,它根據(jù)大量現(xiàn)有文本為您提供最可能的序列,而無需查看功能,另一個是聲學模型,通過查看音頻對進行深度學習訓練和成績單。將這些組合在一起,并應用動態(tài)編碼,該編碼必須實時進行。”

分析命令

上面的命令包含3個主要部分:喚醒字,調(diào)用名稱,提示。

喚醒詞
當用戶說“ Alexa”時,它將喚醒設(shè)備。喚醒詞使Alexa進入聆聽模式,并準備接受用戶的指示。

調(diào)用名稱
調(diào)用名稱是用于觸發(fā)特定“技能”的關(guān)鍵字。用戶可以將調(diào)用名稱與操作,命令或問題結(jié)合使用。所有自定義技能都必須具有一個調(diào)用名稱才能啟動它。

Alexa的“技能”:語音驅(qū)動的Alexa功能。

表述
“Taurus”是一種話語。表述是用戶向Alexa請求時將使用的短語。Alexa從給定的語音識別用戶的意圖,并做出相應的響應。因此,基本上,這些表述決定了用戶希望Alexa執(zhí)行的操作。

什么是NLP?

它是人工智能和計算語言學的融合,它處理機器與人類自然語言之間的相互作用,其中計算機必須分析,理解,更改或生成自然語言。

NLP幫助計算機使用多種形式的自然人類語言進行通信,包括但不限于語音和書寫。

“與計算機進行二十分鐘的閑聊不只是一個月球,而是去火星的旅程?!?/p>

在本文中,我發(fā)現(xiàn)了一個有趣的部分,其中說:“理解人類語言由于其復雜性而被認為是一項艱巨的任務。例如,有無數(shù)種不同的方式來排列句子中的單詞。而且,單詞可能具有多種含義,上下文信息對于正確地解釋句子是必要的。”

開始時,系統(tǒng)會輸入自然語言。

自然語言:任何通過使用和重復在人類中自然進化而無需有意識地計劃或預想的語言。自然語言可以采用不同的形式,例如語音或簽名

之后,它將 它們轉(zhuǎn)換為人工語言,例如語音識別。在這里,我們將數(shù)據(jù)轉(zhuǎn)換為文本形式,通過NLU(自然語言理解)過程來理解其含義。

一個很好的規(guī)則是,如果您只是在談論機器理解我們所說內(nèi)容的能力,請使用術(shù)語NLU。NLU實際上是NLP廣闊世界的一個子集

隱馬爾可夫模型(NLU示例):

在語音識別中,此模型將波形的每個部分與之前發(fā)生的事情和之后發(fā)生的事情進行比較,并與波形字典進行比較以弄清楚正在說什么。

波形:聲帶的周期性振動導致發(fā)聲

隱藏的馬爾可夫模型(HMM)是您觀察排放序列的模型,但不知道模型產(chǎn)生排放所經(jīng)歷的狀態(tài)序列。隱馬爾可夫模型的分析試圖從觀察到的數(shù)據(jù)中恢復狀態(tài)序列。

對于NeoSpeech的市場營銷專家Trevor Jackins來說,“它通過獲取語音數(shù)據(jù)并將其分解為特定時間段(通常為10到20毫秒)的小樣本來嘗試理解您的發(fā)言。將這些數(shù)據(jù)集與預語音進行比較,以解碼您在語音的每個單元中所說的內(nèi)容。這里的目的是找到音素(最小的語音單位)。然后,機器查看一系列這樣的音素,并從統(tǒng)計角度確定最有可能說出的單詞和句子?!?/p>

然后,NLU會深入理解每個單詞,從而嘗試理解它是名詞還是動詞,使用的時態(tài)等。此過程定義為POS:語音標記的一部分。

據(jù)EasyGov的CPO Pramod Chandrayan所說,,“NLP系統(tǒng)也有一個詞匯(詞匯)和一組編碼到系統(tǒng)的語法規(guī)則。現(xiàn)代的NLP算法使用統(tǒng)計機器學習將這些規(guī)則應用于自然語言,并確定您所說內(nèi)容背后最可能的含義?!?/p>

“要構(gòu)建能夠理解自然語言的機器,必須結(jié)合使用規(guī)則和統(tǒng)計模型來提取語音。必須提取,標識和解析實體,并且必須在上下文中派生語義,并將其用于標識意圖。例如,必須解析一個簡單的短語,例如:“我需要從12月5日至10日去巴黎乘坐飛機和預定旅館”,并給出以下結(jié)構(gòu):

need:flight {intent} / need:hotel {intent} / Paris {city} / DEC 5 {date} / DEC 10 {date} / sentiment: 0.5723 (neutral)”

對于作者,主題演講者和顧問 Bernard Marr來說, “當Alexa在解釋您的請求時出錯時,該數(shù)據(jù)將在下一次使系統(tǒng)變得更好時使用。機器學習是語音激活用戶界面功能快速提高的原因?!?/p>

在亞馬遜網(wǎng)站上,我們可以讀到“通過自然語言理解(NLU),計算機可以推斷出說話者的實際含義,而不僅僅是他們說的話?;旧希@就是讓Alexa之類的語音技術(shù)推斷出您可能在詢問“ Alexa,外面的感覺是什么?”時要求本地天氣預報的原因。

如今的語音優(yōu)先技術(shù)是使用NLU構(gòu)建的,NLU是一種人工智能,其重點在于識別人類語言中的模式和含義。以語音助手為代理的自然語言處理已經(jīng)重新定義了我們在家庭和其他方面與技術(shù)交互的方式?!?br />
審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語音識別
    +關(guān)注

    關(guān)注

    39

    文章

    1781

    瀏覽量

    114226
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49016

    瀏覽量

    249460
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    628

    瀏覽量

    14157
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    如何優(yōu)化自然語言處理模型的性能

    優(yōu)化自然語言處理(NLP)模型的性能是一個多方面的任務,涉及數(shù)據(jù)預處理、特征工程、模型選擇、模型調(diào)參、模型集成與融合等多個環(huán)節(jié)。以下是一些具體的優(yōu)化策略: 一、數(shù)據(jù)預處理優(yōu)化 文本清洗
    的頭像 發(fā)表于 12-05 15:30 ?1700次閱讀

    如何使用自然語言處理分析文本數(shù)據(jù)

    使用自然語言處理(NLP)分析文本數(shù)據(jù)是一個復雜但系統(tǒng)的過程,涉及多個步驟和技術(shù)。以下是一個基本的流程,幫助你理解如何使用NLP來分析文本數(shù)據(jù): 1. 數(shù)據(jù)收集 收集文本數(shù)據(jù) :從各種來源(如社交
    的頭像 發(fā)表于 12-05 15:27 ?1575次閱讀

    自然語言處理在聊天機器人中的應用

    上歸功于自然語言處理技術(shù)的進步。 聊天機器人的工作原理 聊天機器人的核心是一個對話系統(tǒng),它能夠處理用戶的輸入(通常是文本形式),并生成相應的回復。這個系統(tǒng)通常包括以下幾個關(guān)鍵組件:
    的頭像 發(fā)表于 12-05 15:24 ?1192次閱讀

    自然語言處理與機器學習的關(guān)系 自然語言處理的基本概念及步驟

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能和語言學領(lǐng)域的一個分支,它致力于研究如何讓計算機能夠理解、解釋和生成人類語言。機器學習(Ma
    的頭像 發(fā)表于 12-05 15:21 ?1985次閱讀

    語音識別與自然語言處理的關(guān)系

    在人工智能的快速發(fā)展中,語音識別和自然語言處理(NLP)成為了兩個重要的技術(shù)支柱。語音識別技術(shù)使得機器能夠理解人類的語音,而自然語言處理則讓機器能夠理解、解釋和生成人類
    的頭像 發(fā)表于 11-26 09:21 ?1501次閱讀

    什么是LLM?LLM在自然語言處理中的應用

    隨著人工智能技術(shù)的飛速發(fā)展,自然語言處理(NLP)領(lǐng)域迎來了革命性的進步。其中,大型語言模型(LLM)的出現(xiàn),標志著我們對語言理解能力的一次飛躍。LLM通過深度學習和海量數(shù)據(jù)訓練,使得
    的頭像 發(fā)表于 11-19 15:32 ?3650次閱讀

    ASR與自然語言處理的結(jié)合

    ASR(Automatic Speech Recognition,自動語音識別)與自然語言處理(NLP)是人工智能領(lǐng)域的兩個重要分支,它們在許多應用中緊密結(jié)合,共同構(gòu)成了自然語言理解和生成的技術(shù)體系
    的頭像 發(fā)表于 11-18 15:19 ?1025次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)在自然語言處理中的應用

    自然語言處理是人工智能領(lǐng)域的一個重要分支,它致力于使計算機能夠理解、解釋和生成人類語言。隨著深度學習技術(shù)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(CNNs)作為一種強大的模型,在圖像識別和語音處理等領(lǐng)域取
    的頭像 發(fā)表于 11-15 14:58 ?804次閱讀

    循環(huán)神經(jīng)網(wǎng)絡(luò)在自然語言處理中的應用

    自然語言處理(NLP)是人工智能領(lǐng)域的一個重要分支,它致力于使計算機能夠理解、解釋和生成人類語言。隨著深度學習技術(shù)的發(fā)展,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)因其在處理序列數(shù)據(jù)方面的優(yōu)勢而在NLP中
    的頭像 發(fā)表于 11-15 09:41 ?814次閱讀

    使用LSTM神經(jīng)網(wǎng)絡(luò)處理自然語言處理任務

    自然語言處理(NLP)是人工智能領(lǐng)域的一個重要分支,它旨在使計算機能夠理解、解釋和生成人類語言。隨著深度學習技術(shù)的發(fā)展,特別是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及其變體——長短期記憶(LSTM)網(wǎng)絡(luò)的出現(xiàn)
    的頭像 發(fā)表于 11-13 09:56 ?1161次閱讀

    自然語言處理的未來發(fā)展趨勢

    隨著技術(shù)的進步,自然語言處理(NLP)已經(jīng)成為人工智能領(lǐng)域的一個重要分支。NLP的目標是使計算機能夠理解、解釋和生成人類語言,這不僅涉及到語言的表層形式,還包括
    的頭像 發(fā)表于 11-11 10:37 ?1726次閱讀

    自然語言處理與機器學習的區(qū)別

    在人工智能的快速發(fā)展中,自然語言處理(NLP)和機器學習(ML)成為了兩個核心的研究領(lǐng)域。它們都致力于解決復雜的問題,但側(cè)重點和應用場景有所不同。 1. 自然語言處理(NLP) 定義:
    的頭像 發(fā)表于 11-11 10:35 ?1547次閱讀

    自然語言處理的應用實例

    在當今數(shù)字化時代,自然語言處理(NLP)技術(shù)已經(jīng)成為我們?nèi)粘I畹囊徊糠帧闹悄苁謾C的語音助手到在線客服機器人,NLP技術(shù)的應用無處不在。 1. 語音識別與虛擬助手 隨著Siri、Google
    的頭像 發(fā)表于 11-11 10:31 ?1609次閱讀

    使用LLM進行自然語言處理的優(yōu)缺點

    自然語言處理(NLP)是人工智能和語言學領(lǐng)域的一個分支,它致力于使計算機能夠理解、解釋和生成人類語言。大型語言模型(LLM)是NLP領(lǐng)域的一
    的頭像 發(fā)表于 11-08 09:27 ?2450次閱讀

    AI智能化問答:自然語言處理技術(shù)的重要應用

    自然語言處理(NLP)是人工智能領(lǐng)域的一個重要分支,它致力于使計算機能夠理解、解釋和生成人類語言。問答系統(tǒng)作為NLP的一個重要應用,能夠精確地解析用戶以自然語言提出的問題,并從包含豐富
    的頭像 發(fā)表于 10-12 10:58 ?1096次閱讀
    AI智能化問答:<b class='flag-5'>自然語言</b><b class='flag-5'>處理</b>技術(shù)的重要應用