
生成式AI助陣,為虛擬數(shù)字人注入靈魂

通過整合生成式AI的能力,虛擬數(shù)字人也找到了更豐富的應用場景。
在電視臺的新聞報道中,虛擬數(shù)字人正逐漸取代傳統(tǒng)的手語老師,提供漢語到手語的實時翻譯,確保聽障人士的觀看體驗。以前,為了讓翻譯準確,手語虛擬數(shù)字人還需要較多的人工干預,在生成式AI出現(xiàn)后,通過對自然語言的理解,AI就能直接讓虛擬數(shù)字人實現(xiàn)漢語、手語互譯的能力。
生成式AI正成為虛擬數(shù)字人智能化的關鍵角色,通過整合生成式AI的能力,虛擬數(shù)字人也找到了更豐富的應用場景。數(shù)字栩生(北京)科技有限公司首席市場官郭學赟表示,生成式AI讓虛擬數(shù)字人從一種單純的虛擬形象,進化成能夠與人互動的智能實體。
從建模到AI,虛擬數(shù)字人的升級之路
虛擬數(shù)字人的制作需要依靠光場建模、動作捕捉等技術,動作捕捉通過捕捉真人的動作來生成數(shù)字人的動作。生成式AI的出現(xiàn),也為虛擬數(shù)字人的制作提供另一種方案——AI生成,讓AI通過算法來生成數(shù)字人匹配的動作。
數(shù)字栩生通過構建人臉數(shù)據庫,供給深度學習算法訓練
郭學赟指出,這兩種技術各有優(yōu)勢,動作捕捉在真實性上表現(xiàn)更好,AI生成則是在靈活性和成本上更勝一籌。為了讓虛擬數(shù)字人提供更真實的視覺體驗,依然需要光場建模和大量的算法模型。
虛擬數(shù)字人的應用浪潮最早出現(xiàn)在影視制作領域,利用傳統(tǒng)的影視技術完成制作;生成式AI的出現(xiàn)和快速迭代,讓虛擬數(shù)字人迎來第二波發(fā)展。
AI極大降低了虛擬數(shù)字人的制作成本,郭學赟表示,通過AI算法,很短時間內生成的2D虛擬數(shù)字人,可以應用到直播等領域,3D數(shù)字人的制作周期也大幅縮減,極大提高了數(shù)字人的生產效率,加速了數(shù)字人從概念到現(xiàn)實的轉化。
由AI驅動,加速應用場景落地
除了生成虛擬數(shù)字人,生成式AI也能幫助虛擬數(shù)字人獲得交互能力,并且在功能上不斷擴展。虛擬數(shù)字人已經被應用于智能客服、教育輔助、娛樂互動等多個領域,例如,銀行和教育機構已經開始利用數(shù)字人提供服務,而娛樂行業(yè)則利用數(shù)字人進行互動表演和游戲。
數(shù)字栩生推出的虛擬數(shù)字人已經深入多個領域,主要包括游戲娛樂、教育講解、手語服務、名人復現(xiàn)等等。
國內首個京劇數(shù)字人“數(shù)字梅蘭芳”
游戲娛樂方面,通過與虛擬數(shù)字人的結合,在線游戲將獲得更智能的NPC,線下娛樂場所也能通過虛擬數(shù)字人提供更豐富的娛樂體驗。在北京三里屯的一家KTV,數(shù)字栩生的數(shù)字人不僅可以充當服務員的角色,還能搖身一變成為現(xiàn)場的DJ或主持人。在游戲中,虛擬數(shù)字人形態(tài)的NPC能夠與玩家實時交互,由AI實時生成動態(tài)的對話和反應,而不是傳統(tǒng)NPC的預設劇本,更有沉浸感。
教育講解方面,虛擬數(shù)字人可以擔任講解員或輔助教師,例如在景區(qū)、博物館等公共場所提供講解服務。虛擬數(shù)字人在景點或博物館中擔任講解員,能夠向參觀者提供詳細的展品解說和歷史背景介紹。對于圖書館或大型展覽,虛擬數(shù)字人也可以提供導覽服務,指引訪客瀏覽不同的區(qū)域,并提供關鍵信息。在教育場景中,數(shù)字人可以用作教學輔助工具,幫助解釋復雜的概念或進行語言學習練習。
為上海博物館“古埃及文明大展”提供導覽服務的AI數(shù)字人“小可”
手語服務方面,虛擬數(shù)字人被應用到廣電和特殊教育場景,提供標準化的手語翻譯。郭學赟表示,數(shù)字栩生公司在手語數(shù)字人領域與專業(yè)機構合作,確保手勢的準確性和標準化,同時利用AI技術提升信息服務的可接入性。事實上,在北京冬奧會期間,手語虛擬數(shù)字人得到了更加廣泛的應用,為聽障觀眾提供無障礙的觀看體驗。
名人復現(xiàn)方面,數(shù)字栩生通過與北京理工大學、中央戲劇學院等機構的共同合作,復原了如梅蘭芳等歷史名人的數(shù)字化形象,提供更好的傳統(tǒng)文化教育和傳播。郭學赟提到,他們曾完成“梅蘭芳”、“魯迅”、“李大釗”等歷史名人的數(shù)字化復原。
挑戰(zhàn)與前景,虛擬數(shù)字人的未來
虛擬數(shù)字人的制作和功能落地是一個復雜的過程,涉及大量的技術細節(jié)。盡管AI拉近了虛擬數(shù)字人與真人的差距,但情感表達和交互能力上,當前的技術很難讓虛擬數(shù)字人完美實現(xiàn)。
數(shù)字栩生參與打造的高逼真數(shù)字演員“春草”
除此之外,人們對虛擬數(shù)字人的接受程度仍然存在挑戰(zhàn)。盡管虛擬數(shù)字人技術在某些領域已經得到應用,但市場仍處于發(fā)展階段。用戶對虛擬數(shù)字人的認知和接受程度,將直接影響數(shù)字人技術的普及和應用。
虛擬數(shù)字人市場尚未成熟,競爭卻已經非常激烈,尤其是在技術能力和設計美學方面,競爭者們也各有優(yōu)勢。不過對普通用戶來說,當前的虛擬數(shù)字人仍然缺乏真人的情感價值與柔和性,這意味著數(shù)字人在真實性和情感表達方面仍有長遠的路要走。郭學赟認為,虛擬數(shù)字人技術充滿可能性,數(shù)字栩生還在探索如何將虛擬數(shù)字人技術應用于高端養(yǎng)老和情感療愈中,但目前還存在很多限制,需要時間和進一步的技術發(fā)展才能解決。
本文章選自《數(shù)字化轉型方略》雜志,閱讀更多雜志內容,請掃描下方二維碼
