
虛擬數(shù)字人因“AI”破繭 多元場景煥新

當(dāng)生成式AI時代的東風(fēng)吹過,便為虛擬數(shù)字人企業(yè)開啟了一場蛻變。
無論是電商領(lǐng)域,虛擬數(shù)字人化身虛擬主播、客服,創(chuàng)新購物體驗,提升平臺效率;還是文旅領(lǐng)域,虛擬數(shù)字人扮演者導(dǎo)游角色,豐富旅行體驗,注入產(chǎn)業(yè)新活力;或是影視領(lǐng)域,擔(dān)任特效角色、虛擬偶像,營造逼真視覺的虛擬數(shù)字人,開創(chuàng)了娛樂的新形式......
當(dāng)前,虛擬數(shù)字人行業(yè)得益于生成式AI、實時渲染、動作捕捉和語音合成等技術(shù)的進步,正在迅速發(fā)展和變革在多個應(yīng)用場景,展現(xiàn)出廣泛的應(yīng)用潛力和實際價值。
在生成式AI問世之前,虛擬數(shù)字人的發(fā)展可謂歷經(jīng)坎坷。高昂的制作成本和技術(shù)門檻讓許多企業(yè)望而卻步,建模、動畫和渲染過程復(fù)雜且耗時,且傳統(tǒng)虛擬數(shù)字人的互動體驗單一,主要依賴預(yù)設(shè)腳本和動畫,顯得機械且不自然;虛擬數(shù)字人的應(yīng)用場景有限,多集中在娛樂和廣告領(lǐng)域,難以在教育、醫(yī)療和企業(yè)服務(wù)等其他行業(yè)中普及。
正因如此,虛擬數(shù)字人的普及和商業(yè)化應(yīng)用受到極大限制。而近幾年來,隨著生成式AI提高了虛擬數(shù)字人的交互能力,推動著虛擬數(shù)字人在現(xiàn)有應(yīng)用場景中的更深入應(yīng)用,虛擬數(shù)字人如雨后春筍一般涌現(xiàn),成為各行業(yè)的“寵兒”。
東風(fēng)——虛擬數(shù)字人的“AI”之變
對于作為虛擬數(shù)字人企業(yè)的北京海百川科技(以下簡稱“海百川科技”)而言,當(dāng)生成式AI時代的東風(fēng)吹過,便為其開啟了一場蛻變。
從娛樂、電商,到企業(yè)服務(wù)和醫(yī)療健康,再到智慧城市,F(xiàn)在,海百川科技的虛擬數(shù)字人產(chǎn)品和服務(wù),在生成式AI加持下正深入各個領(lǐng)域。更是推出了虛擬偶像、虛擬演員、虛擬導(dǎo)購、虛擬主播、虛擬客服、虛擬導(dǎo)覽;AI攝像師、AI畫師和AI剪輯師等數(shù)字人形態(tài)產(chǎn)品等多種解決方案。
虛擬人背后的現(xiàn)實能力,來源于“圖靈九歌大模型”中臺系統(tǒng),憑借多模態(tài)智能內(nèi)容生成與交互模型的能力,能夠?qū)⒓夹g(shù)與數(shù)據(jù)轉(zhuǎn)化為各行各業(yè)的“AI員工”促進企業(yè)提高工作流效率,通過整合最前沿的人工智能技術(shù),為企業(yè)提供高效、精準的智能內(nèi)容生成和互動解決方案。
北京海百川科技聯(lián)合創(chuàng)始人、副總經(jīng)理 楊星蕊
北京海百川科技聯(lián)合創(chuàng)始人、副總經(jīng)理楊星蕊解釋說,“圖靈九歌大模型”融合了海百川科技自研的TURING GANS深度學(xué)習(xí)算法和TURING VAE大數(shù)據(jù)處理技術(shù),能夠快速構(gòu)建并優(yōu)化各類模型,為企業(yè)提供強有力的智能化轉(zhuǎn)型支持。
除了技術(shù)上的創(chuàng)新,海百川科技的前期積累也是強有力的支撐。
其實,早在2014年,海百川科技旗下的“AI Star”就開始研發(fā)AI換臉相關(guān)技術(shù),并建立了較成熟的算法模型。
到2019年,國內(nèi)掀起了“AI換臉”風(fēng)潮,海百川科技便順理成章地在這一時期立在潮頭。
當(dāng)稱之為元宇宙“元年”的2021年到來,海百川科技用便開始用AI算法生成虛擬形象,進行直播互動、拍攝寫真及短視頻。
基于多年積累的豐富語料庫和數(shù)字人資產(chǎn)庫,讓海百川科技為虛擬數(shù)字人提供了多樣化的知識基礎(chǔ)和語言表達能力。同時,海百川科技還通過整合OpenAI行業(yè)領(lǐng)先的開源大模型,增強虛擬數(shù)字人的語言理解和生成能力。“這些開源模型經(jīng)過廣泛的數(shù)據(jù)訓(xùn)練,具備強大的通用性和靈活性,能夠處理復(fù)雜的語言任務(wù)。”楊星蕊強調(diào)。
這種半開源半自研的策略,使海百川科技在生成式AI和虛擬數(shù)字人的融合之路上走的更加順暢。
模式——虛擬數(shù)字人開辟多元新場景
現(xiàn)在,海百川科技憑借其虛擬數(shù)字人技術(shù),在娛樂、教育、文化旅游、先進制造業(yè)及數(shù)字內(nèi)容創(chuàng)作領(lǐng)域開辟了新天地,徹底改變了其傳統(tǒng)服務(wù)模式,推動了個性化和智能化服務(wù)的發(fā)展。
在娛樂領(lǐng)域,海百川科技的虛擬偶像和演員正通過AI和動作捕捉技術(shù),為觀眾帶來沉浸式體驗。楊星蕊直言:“我們的目標是通過高科技手段減少影視制作成本,同時提升視覺效果的真實性。”
在教育行業(yè),海百川科技與高校的合作中,開發(fā)了虛擬慕課系統(tǒng)。虛擬教師能夠根據(jù)學(xué)生的學(xué)習(xí)進度提供個性化輔導(dǎo),從而提高教學(xué)質(zhì)量。楊星蕊解釋說:“這種技術(shù)的應(yīng)用,使得技術(shù)探索和創(chuàng)新教育更加容易。”
這兩年火熱的文旅領(lǐng)域也不例外,在福建的茶葉元宇宙項目中,海百川科技的虛擬導(dǎo)覽角色不僅提供實時信息,還增加了與游客的互動性。“通過虛擬技術(shù),我們能夠重現(xiàn)歷史文化,增強游客的文化體驗,”楊星蕊坦言。
在先進制造業(yè)和數(shù)字內(nèi)容創(chuàng)作領(lǐng)域,也能看到海百川科技的虛擬數(shù)字人技術(shù)被應(yīng)用其中,被作為提高制造企業(yè)的運營效率、加速了高質(zhì)量內(nèi)容的生成的“利器”。楊星蕊提到,“在輕紡城元宇宙產(chǎn)品交易平臺中,虛擬數(shù)字人的3D商品展示和實時渲染技術(shù),為用戶創(chuàng)造了全新的購物體驗。”
事實上,生成式AI顯著降低了制作成本和技術(shù)門檻,提高了其廣泛應(yīng)用的可能性。這項技術(shù)賦予虛擬數(shù)字人自我學(xué)習(xí)和進化的能力,大大增強了它們的交互性和情感表達,讓虛擬數(shù)字人不僅可以實時與用戶對話,理解并回應(yīng)需求,提供個性化服務(wù)。還能模擬人類情感,與用戶建立更深層次的情感連接,極大程度地提升了虛擬數(shù)字人的場景適應(yīng)能力。
當(dāng)技術(shù)創(chuàng)新和商業(yè)模式不斷優(yōu)化,虛擬數(shù)字人將在更多領(lǐng)域發(fā)揮重要作用,提升體驗和服務(wù)效率。楊星蕊預(yù)計,隨著技術(shù)成熟和應(yīng)用場景的擴展,預(yù)計未來三到五年內(nèi),虛擬數(shù)字人將在更多行業(yè)和場景中廣泛應(yīng)用。
她舉例稱,在文化旅游領(lǐng)域,虛擬導(dǎo)游能提供沉浸式講解和互動體驗,并通過虛擬現(xiàn)實技術(shù)生動展示旅游目的地;在文化出海方面,虛擬數(shù)字人將推動中華文化全球傳播,以虛擬演出和藝術(shù)展覽讓海外觀眾深入了解中華文化。
虛擬數(shù)字人還可在國際文化交流中擔(dān)任文化大使,促進跨文化理解。技術(shù)創(chuàng)新和商業(yè)模式優(yōu)化將使虛擬數(shù)字人在娛樂、文化旅游和國際交流等領(lǐng)域發(fā)揮重要作用,提升體驗和服務(wù)效率。
演進——技術(shù)創(chuàng)新 場景深化
盡管新一代虛擬數(shù)字人已經(jīng)走入普羅大眾的視野,但熱度持續(xù)提升的“B面”是日新月異的技術(shù)更迭、用戶體驗的更多訴求,都在向這一新興賽道發(fā)起挑戰(zhàn)。當(dāng)市場開始逐漸回歸理性,行業(yè)將更加關(guān)注數(shù)字人在場景中的表現(xiàn),以及落地后的成效和商業(yè)價值。
事實上,盡管虛擬數(shù)字人技術(shù)在高精度渲染方面已經(jīng)取得顯著進步,但在大規(guī)模應(yīng)用場景中仍需優(yōu)化,以確保每個虛擬數(shù)字人的表現(xiàn)質(zhì)量和流暢度。實時交互技術(shù)在處理復(fù)雜對話和多輪交互時,也仍需提高響應(yīng)速度和準確性。同樣的,融入生成式AI的虛擬數(shù)字人在落地成效上,也面臨技術(shù)的穩(wěn)定性、用戶接受度,以及具體應(yīng)用場景的適配等問題。
談及技未來的優(yōu)化方向,楊星蕊強調(diào)了四個關(guān)鍵層面。
第一,提升表現(xiàn)力和自然度:進一步改進虛擬數(shù)字人的面部表情和動作捕捉技術(shù),使其表現(xiàn)更加逼真和自然,增強用戶的沉浸感。
第二,加強情感計算和多模態(tài)交互能力:開發(fā)更先進的情感計算模型,使虛擬數(shù)字人能夠識別和表達更復(fù)雜的情感狀態(tài);同時,增強虛擬數(shù)字人與用戶在視覺、聽覺和觸覺等多模態(tài)上的交互能力。
第三,優(yōu)化大規(guī)模應(yīng)用場景中的性能和穩(wěn)定性:提升系統(tǒng)的計算效率和穩(wěn)定性,確保在大規(guī)模應(yīng)用中依然能夠提供高質(zhì)量的服務(wù),滿足用戶的需求。
第四,數(shù)據(jù)隱私和安全:持續(xù)關(guān)注和改進數(shù)據(jù)隱私和安全問題,確保用戶數(shù)據(jù)的安全性和隱私保護,建立用戶對虛擬數(shù)字人的信任。
對于海百川科技而言,下一步將繼續(xù)深化虛擬數(shù)字人的技術(shù)研發(fā),重點提升智能化和交互能力,加強開發(fā)更加逼真的面部表情和動作捕捉技術(shù),增強虛擬數(shù)字人的情感表達和互動體驗。同時,拓展更多的應(yīng)用場景重點布局智慧城市和醫(yī)療健康等領(lǐng)域。在智慧城市方面,虛擬數(shù)字人將作為智能助手,提供城市信息、公共服務(wù)和緊急響應(yīng)等功能;在醫(yī)療健康領(lǐng)域,虛擬數(shù)字人將輔助醫(yī)療診斷、健康管理和患者隨訪,提升醫(yī)療服務(wù)的效率和精準度。
楊星蕊進一步透露,海百川科技還會加強產(chǎn)學(xué)研合作,帶動產(chǎn)業(yè)鏈發(fā)展。通過建立開放合作的平臺,希望與更多的企業(yè)、研究機構(gòu)和開發(fā)者攜手,共同探索和開發(fā)新的應(yīng)用場景和商業(yè)模式,推動虛擬數(shù)字人技術(shù)的普及和應(yīng)用。
隨著技術(shù)的加快演進,虛擬數(shù)字人技術(shù)應(yīng)用場景的不斷增多,企業(yè)需要面對如何挑選最適合自己的開發(fā)商這一問題。“技術(shù)實力、產(chǎn)品成熟度、客戶案例、服務(wù)支持、數(shù)據(jù)安全,是企業(yè)在選擇虛擬數(shù)字人技術(shù)提供商時,應(yīng)該主要關(guān)注的維度。”楊星蕊說。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
