
生成式AI帶來“新生” 智境云創(chuàng)多舉措推動推動數(shù)字人規(guī)模化落地

智境云創(chuàng)將拓展AI數(shù)字人在各行業(yè)的應用場景,定制化解決方案,并加強與產(chǎn)業(yè)鏈上下游企業(yè)的合作,共同構(gòu)建AI數(shù)字人生態(tài)系統(tǒng)。
數(shù)字人行業(yè)正處于前所未有的快速發(fā)展期。2023年,中國虛擬人核心市場規(guī)模達到了205.2億元,并預計到2025年將達到480.6億元。技術(shù)的進步是推動這一行業(yè)發(fā)展的核心動力,AIGC等前沿技術(shù)的應用極大地提升了數(shù)字人的交互能力、內(nèi)容生成能力及智能化水平。
數(shù)字人的應用場景已經(jīng)從傳統(tǒng)的影視娛樂領域擴展到了品牌營銷、電商直播、金融教育等多個領域,為各行各業(yè)帶來全新的交互體驗和服務模式。
智境云創(chuàng)創(chuàng)始人&CEO王智武告訴記者,智境云創(chuàng)注重技術(shù)創(chuàng)新與應用拓展,特別是AI與3D技術(shù)的融合。公司持續(xù)投入研發(fā)資源,在前沿技術(shù)領域進行探索和突破,提升數(shù)字人的智能水平和交互能力,并關注新興技術(shù)如3D數(shù)據(jù)集、AIGC、大模型等的融合應用。同時,智境云創(chuàng)將拓展AI數(shù)字人在各行業(yè)的應用場景,定制化解決方案,并加強與產(chǎn)業(yè)鏈上下游企業(yè)的合作,共同構(gòu)建AI數(shù)字人生態(tài)系統(tǒng)。
此外,公司還根據(jù)市場需求和競爭態(tài)勢靈活調(diào)整市場布局,積極探索數(shù)字人技術(shù)的國際化應用和推廣,特別是在AI+3D技術(shù)方面的全球化發(fā)展,不斷拓寬數(shù)字人的應用領域和市場邊界。
生成式AI讓數(shù)字人“煥發(fā)新生”
在生成式AI出現(xiàn)之前,數(shù)字人的發(fā)展面臨了多方面的挑戰(zhàn),包括技術(shù)上的建模與渲染、動作與表情捕捉、語音合成與交互的不成熟,資源上的計算和數(shù)據(jù)獲取成本高昂,倫理上的隱私保護和形象權(quán)歸屬問題,以及應用上的用戶接受度低和技術(shù)整合難度大等問題。
然而,生成式AI技術(shù)的出現(xiàn)極大地改變了這一狀況。它不僅顯著提升了數(shù)字人在建模、渲染、交互等多方面的技術(shù)水平,還極大地豐富了數(shù)字人的應用場景,拓展了其商業(yè)價值。
生成式AI技術(shù)為數(shù)字人帶來了多項新能力,包括高度個性化的定制能力、多模態(tài)交互能力、自主學習與進化能力,以及情感理解與陪伴能力。這些新能力不僅增強了數(shù)字人的實用性和用戶體驗,還使其更加符合用戶的期望和需求。智境云創(chuàng)將充分利用這些技術(shù)優(yōu)勢,為用戶帶來更加優(yōu)質(zhì)、便捷和個性化的數(shù)字人體驗。
王智武表示,生成式AI技術(shù)的加入,極大地擴展了數(shù)字人的落地場景。與過去相比,數(shù)字人現(xiàn)在不僅應用于影視、游戲等娛樂領域,還深入到了教育、金融、零售等多個行業(yè),提供了個性化教學、專業(yè)理財建議、個性化營銷等多樣化服務。同時,數(shù)字人的交互能力也得到了顯著提升,能夠與用戶進行更加自然、流暢的對話,并結(jié)合多種模態(tài)進行交互。此外,個性化定制服務和自主學習與進化能力的增強,也使得數(shù)字人能夠更好地適應不同場景下的需求變化,提供更加精準和個性化的服務。
化解生成式AI與數(shù)字人的融合挑戰(zhàn)
雖然生成式AI與數(shù)字人的融合是大勢所趨,但是挑戰(zhàn)也顯而易見,包括技術(shù)層面的模型訓練與數(shù)據(jù)需求、計算資源消耗、多模態(tài)交互協(xié)同以及情感理解與表達;倫理法律層面的隱私保護、版權(quán)與知識產(chǎn)權(quán)界定、內(nèi)容真實性與可信度保障;用戶體驗層面的個性化與定制化服務、交互自然度提升以及一致性與穩(wěn)定性確保;以及商業(yè)化層面的商業(yè)模式探索和市場競爭應對。
這些挑戰(zhàn)需要企業(yè)、研究機構(gòu)和社會各界共同努力,通過技術(shù)創(chuàng)新、行業(yè)規(guī)范、用戶體驗優(yōu)化和商業(yè)模式創(chuàng)新等方式來逐步解決。
王智武表示,當前數(shù)字人技術(shù)雖然取得了顯著進展但仍存在一些不足之處。以下是一些可能的不足點和未來的優(yōu)化方向:
真實感與交互性不足:盡管數(shù)字人在視覺和聲音效果上已經(jīng)取得了很大進步但在真實感和交互性方面仍有待提升。未來的優(yōu)化方向可能包括引入更高級的圖形渲染技術(shù)和動作捕捉技術(shù)以提高數(shù)字人的逼真度和自然度;同時加強多模態(tài)交互技術(shù)的研發(fā)以實現(xiàn)更加自然和流暢的交互體驗。
智能水平有限:當前數(shù)字人的智能水平仍受到算法和模型性能的限制在復雜語境理解、情感計算等方面仍有待提升。未來的優(yōu)化方向可能包括加強預訓練大模型和垂域小模型的研發(fā)和應用以提高數(shù)字人的智能水平和泛化能力;同時引入更多領域知識和規(guī)則以豐富數(shù)字人的知識庫和決策依據(jù)。
個性化與定制化不足:不同用戶對于數(shù)字人的需求和期望存在差異但在個性化與定制化方面仍有待提升。未來的優(yōu)化方向可能包括加強用戶畫像和行為分析技術(shù)的研究以更好地理解用戶需求;同時提供更加豐富和靈活的定制化選項以滿足不同用戶的個性化需求。
隱私與安全問題:隨著數(shù)字人技術(shù)的普及和應用隱私與安全問題也日益凸顯。未來的優(yōu)化方向可能包括加強數(shù)據(jù)加密和隱私保護技術(shù)的研究以保障用戶隱私的安全;同時建立完善的安全機制和監(jiān)管體系以應對潛在的安全威脅和風險。
基于這些思考,智境云創(chuàng)在提升數(shù)字人交互能力方面,采取了自研智者千問大模型與合作接入相結(jié)合的方式。一方面,智境云創(chuàng)自研了“智者千問”行業(yè)大模型,通過大規(guī)模的預訓練和自學習,學會語言的語義和語法。在預訓練時,處理海量文本,學到很多語言知識和模式,所以能理解和生成各種語言,適應不同的場景和任務。與自研元享云平臺組成“AI+3D的元宇宙多模態(tài)云平臺”,為數(shù)字人提供了復雜語境理解、長時間連貫性問答以及多語言交流服務的能力。另一方面,智境云創(chuàng)也積極與行業(yè)內(nèi)領先的企業(yè)和機構(gòu)進行合作,通過接入外部大模型來進一步豐富和提升數(shù)字人的交互能力。這種自研與合作相結(jié)合的方式使得智境云創(chuàng)在數(shù)字人交互技術(shù)方面保持了領先地位并持續(xù)進行創(chuàng)新。
推動數(shù)字人的規(guī);涞
在王智武看來,數(shù)字人的規(guī);涞睾腿诤线M產(chǎn)業(yè)是一個復雜而長期的過程涉及技術(shù)、市場、政策等多個方面的因素。雖然當前數(shù)字人技術(shù)已經(jīng)取得了顯著進展但在規(guī);涞睾彤a(chǎn)業(yè)化應用方面仍面臨一些挑戰(zhàn)。不過隨著技術(shù)的不斷進步和應用場景的不斷拓展數(shù)字人的規(guī);涞睾彤a(chǎn)業(yè)化應用已經(jīng)初具雛形并有望在未來幾年內(nèi)取得更大進展。
具體來說數(shù)字人的規(guī)模化落地和產(chǎn)業(yè)化應用需要解決以下幾個關鍵問題:一是技術(shù)成熟度和穩(wěn)定性問題需要通過持續(xù)的技術(shù)創(chuàng)新和優(yōu)化來提高數(shù)字人的性能和可靠性;二是市場需求和接受度問題需要通過深入了解用戶需求和應用場景來推動數(shù)字人在更多領域的落地應用;三是政策支持和監(jiān)管問題需要加強政策引導和監(jiān)管力度以規(guī)范數(shù)字人產(chǎn)業(yè)的發(fā)展秩序和保障用戶權(quán)益。
在技術(shù)創(chuàng)新方面,依托在數(shù)據(jù)、算法、算力三大核心要素的持續(xù)積淀,智境云創(chuàng)通過大規(guī)模、高精度的3D數(shù)據(jù)進行模型訓練,讓AI更全面地理解和計算物理世界;再通過跨模態(tài)的數(shù)據(jù)算法融合。讓虛擬世界更接近真實,讓物理世界更加智能。
智境云創(chuàng)的數(shù)字人產(chǎn)品具備文本、語音、動作等多模態(tài)交互能力,可以適用于VR、MR、AR等多樣化智能終端。這種多模態(tài)交互技術(shù)使得數(shù)字人能夠更自然地與用戶進行互動,提升用戶體驗。
智境云創(chuàng)自研了“智者千問”行業(yè)大模型,與元享云平臺組成“AI+3D的空間計算多模態(tài)云平臺,平臺核心驅(qū)動力在于AI與大模型的深度應用,它們共同構(gòu)建了一站式AI智能服務體系,涵蓋了生成、驅(qū)動、數(shù)智人交互等多個環(huán)節(jié)。
在空間計算領域,智境云創(chuàng)具備3D數(shù)據(jù)采集、訓練、內(nèi)容創(chuàng)作、云渲染等方面的優(yōu)勢。這些技術(shù)為數(shù)字人的生成和交互提供了堅實的基礎,使得數(shù)字人在視覺和交互效果上更加逼真和流暢。
在行業(yè)方面,智境云創(chuàng)針對教育、金融、電商等多個應用場景打造了數(shù)字人解決方案。智境云創(chuàng)在數(shù)字人領域已經(jīng)成功實施了多個案例,并取得了顯著的效果。例如,智境云創(chuàng)與華山景區(qū)攜手合作,共同推出了虛擬形象——沉小香。這一創(chuàng)新舉措將傳統(tǒng)文化與現(xiàn)代科技完美融合,為游客帶來前所未有的沉浸式旅游體驗。沉小香作為華山景區(qū)的虛擬代言人,不僅擁有文人俠士的清新脫俗外形,更蘊含著深厚的文化內(nèi)涵和華山精神的獨特魅力。以數(shù)字化的形式,活靈活現(xiàn)地展現(xiàn)華山的歷史傳說、自然風光與人文風情,引領游客穿梭于現(xiàn)實與虛擬交織的奇妙世界,感受華山的壯麗與神秘,開啟一場別開生面的文化探索之旅。此外,智境云創(chuàng)還攜手外研在線打造了虛擬數(shù)字人“子衿”,在教育領域的應用中,子衿能夠為學生提供個性化的學習輔導和情感支持,提高了教學效果和學習體驗。
結(jié)語
數(shù)字人的規(guī);涞睾腿诤线M產(chǎn)業(yè)是一個復雜而長期的過程,涉及技術(shù)、市場、政策等多個方面的因素。雖然當前數(shù)字人技術(shù)已經(jīng)取得了顯著進展,但在規(guī);涞睾彤a(chǎn)業(yè)化應用方面仍面臨一些挑戰(zhàn)。不過隨著技術(shù)的不斷進步和應用場景的不斷拓展,數(shù)字人的規(guī);涞睾彤a(chǎn)業(yè)化應用已經(jīng)初具雛形,并有望在未來幾年內(nèi)取得更大進展。
數(shù)字人市場競爭格局呈現(xiàn)出多元化特點,眾多參與者憑借各自的技術(shù)優(yōu)勢和市場渠道展開激烈競爭,推動了整個行業(yè)的快速發(fā)展。政策支持力度的加大也為數(shù)字人行業(yè)的發(fā)展提供了有力保障,政府在數(shù)據(jù)政策、人才培養(yǎng)等方面的舉措將進一步促進數(shù)字人行業(yè)的繁榮。
最后,王智武表示,企業(yè)在選擇數(shù)字人技術(shù)提供商時,應綜合考慮技術(shù)實力與經(jīng)驗、成功案例與作品、資質(zhì)與合規(guī)性、定制化能力、服務與支持以及價格與性價比等多個維度。技術(shù)實力是確保項目成功的關鍵,成功案例能夠評估提供商的項目執(zhí)行能力和成果質(zhì)量,資質(zhì)合規(guī)性保障項目的合法性和企業(yè)信息的安全,定制化能力確保滿足企業(yè)的個性化需求,服務與支持則保障項目執(zhí)行過程中的問題解決和技術(shù)更新,而價格與性價比則需綜合考慮以確保投資回報。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
