AI數(shù)字人的底層邏輯主要基于兩種操作機(jī)制。一種是智能驅(qū)動型數(shù)字人,這種類型的數(shù)字人通過智能系統(tǒng)自動讀取和解析外界輸入信息,然后根據(jù)解析結(jié)果決策數(shù)字人后續(xù)的輸出文本,最后驅(qū)動人物模型生成相應(yīng)的語音與動作,實現(xiàn)與用戶的互動。這個人物模型是通過AI技術(shù)預(yù)先訓(xùn)練得到的,能夠通過文本驅(qū)動生成語音和對應(yīng)動畫,業(yè)內(nèi)將此模型稱為 TTSA(Text To Speech & Animation)人物模型。
另一種是真人驅(qū)動型數(shù)字人,其核心原理是由真人根據(jù)視頻監(jiān)控系統(tǒng)傳來的用戶視頻,與用戶進(jìn)行實時語音交流,同時通過動作捕捉采集系統(tǒng)將真人的表情、動作呈現(xiàn)在虛擬數(shù)字人形象上,從而實現(xiàn)與用戶的交互。
從技術(shù)角度來看,AI數(shù)字人的本質(zhì)是人工智能的一種進(jìn)化。它整合了人物形象模擬、人物聲音克隆、自然語言處理、知識圖譜解析等眾多世界領(lǐng)先的人工智能技術(shù),提供了一種可以隨時隨地與真人進(jìn)行準(zhǔn)確交互性對話的方式。背后的技術(shù)原理涉及到符號主義、聯(lián)結(jié)主義和行為主義等多種研究視角。
隨著新技術(shù)浪潮的推動,虛擬數(shù)字人的制作過程得到有效簡化,性能也得到飛躍式提升,開始從外觀的數(shù)字化逐漸深入到行為的交互化、思想的智能化?,F(xiàn)在,以虛擬主播、虛擬員工等為代表的數(shù)字人已經(jīng)開始在影視、游戲、傳媒、文旅、金融等眾多領(lǐng)域大放異彩。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
88文章
35109瀏覽量
279642 -
人工智能
+關(guān)注
關(guān)注
1806文章
49011瀏覽量
249374 -
數(shù)字人
+關(guān)注
關(guān)注
0文章
153瀏覽量
2291
發(fā)布評論請先 登錄
從底層邏輯到架構(gòu)設(shè)計:聚徽解析MES看板的技術(shù)實現(xiàn)路徑
地平線余凱稱輔助駕駛的底層邏輯正在改寫
生成式人工智能認(rèn)證:重塑AI職業(yè)生態(tài)的底層邏輯
OBOO鷗柏丨AI數(shù)字人觸摸屏查詢觸控人臉識別語音交互一體機(jī)上市

邏輯推理AI智能體的實際應(yīng)用
鴻道Intewell操作系統(tǒng):人形機(jī)器人底層操作系統(tǒng)
大象機(jī)器人攜手進(jìn)迭時空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品
SMA 接頭與 PCB 原理圖連接的底層邏輯

【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗】+初品Agent
鴻道AI機(jī)器人操作系統(tǒng)亮相中關(guān)村論壇

一文讀懂:SMA插頭與PCB原理圖連接的底層邏輯

雙十一百元投入即可擁有數(shù)字人!華為云 Flexus 數(shù)字人輕松上手

評論