數(shù)字人應(yīng)用漸成趨勢 商湯如影2.0支持4K多語種

來源:經(jīng)濟(jì)參考網(wǎng)

隨著AIGC技術(shù)的進(jìn)步,“數(shù)字人”也迎來了快速發(fā)展期。在大數(shù)據(jù)與語言大模型的加持下,“數(shù)字人”的表述變得更加個(gè)性化、多元化,也開始被應(yīng)用到越來越多的場景之中。

如今,我們不僅在直播間、短視頻平臺上能看到越來越多的數(shù)字人形象,還能在圖書館、商場的電子屏幕上發(fā)現(xiàn)數(shù)字人的身影。


(資料圖)

那么,如何才能獲取一個(gè)屬于自己的“數(shù)字人”呢?

在應(yīng)用商店里,我們發(fā)現(xiàn)商湯科技研發(fā)的“如影”App已經(jīng)上線,同時(shí)官方還啟動(dòng)了AIGC百“變”大咖共建計(jì)劃。目前,已經(jīng)有張泉靈、任澤平、延參法師、季衛(wèi)東等知名人士參加了該活動(dòng),同時(shí)定制了鮮活逼真的數(shù)字分身。

據(jù)了解,“如影”App正是基于商湯科技“日日新SenseNova”大模型體系開發(fā)的。借助AI數(shù)字人視頻生成算法、語言大模型、AI文生圖、AIGC等多種能力,只需一次真人素材錄入,商湯如影就能生成超寫實(shí)的數(shù)字分身,實(shí)現(xiàn)高質(zhì)量、高效率的數(shù)字人視頻內(nèi)容創(chuàng)作,推動(dòng)視頻內(nèi)容創(chuàng)作的方式革新。

擁有量身定制的“數(shù)字人”之后,Ta能代替我們出現(xiàn)在哪些場景?

“未見其人,先聞其聲”,聲音是模仿一個(gè)人的關(guān)鍵。定制好數(shù)字人后,只要輸入你喜歡的歌曲音頻,數(shù)字人就能根據(jù)你的音色演唱任何歌曲。在各種播客平臺,量產(chǎn)音頻不是夢。

除了復(fù)刻你本來的樣子,數(shù)字人的外貌也可以完成個(gè)性化定制。在商湯秒畫大模型的支持下,僅需輸入簡單的提示詞,商湯如影就能直接生成與之匹配的形象,且版權(quán)完全屬于自己。

商湯數(shù)字人也可以將外貌與聲音完美融合,表情、口型都能自然而逼真地呈現(xiàn),再加上一些肢體動(dòng)作,生成短視頻也不在話下。在上海長寧圖書館,商湯打造的數(shù)字人“馨葉”已經(jīng)成為正式的引導(dǎo)員,不僅能根據(jù)讀者個(gè)人喜好推薦館內(nèi)書籍、完成借閱和座位預(yù)約等操作,還能與讀者自然對話,再加上表情、手勢和動(dòng)作,交互體驗(yàn)十分優(yōu)秀。

據(jù)悉,商湯如影2.0在英語、日語、阿拉伯語等多語種的語音和口型流暢度提升30%以上,表達(dá)自然不違和?,F(xiàn)在還可以生成4K分辨率的視頻,畫質(zhì)更高清。

目前,商湯如影已與多個(gè)短視頻、直播頭部企業(yè)達(dá)成戰(zhàn)略合作,共同打造“云+AIGC+短視頻直播”合作生態(tài)。同時(shí)還推出了“千城百業(yè)”如影繁星合作伙伴共建計(jì)劃,為不同行業(yè)場景的企業(yè)和大眾,提供更高效、低成本、便捷易用的AI視頻和營銷工具。

雖然已經(jīng)有很多大企業(yè)推出了數(shù)字人產(chǎn)品,但在成熟度方面,商湯走在了行業(yè)前列。

全球知名研究機(jī)構(gòu)弗若斯特沙利文(Frost &Sullivan)聯(lián)合頭豹研究院發(fā)布了《2022年中國數(shù)字人市場觀測報(bào)告-里程碑》。報(bào)告顯示,商湯科技數(shù)字人已全面進(jìn)入“成熟階段”成為市場領(lǐng)導(dǎo)者,并在十個(gè)評估指標(biāo)中獲得六項(xiàng)最高分,廠商整體競爭力排名第一。同時(shí),據(jù)國際數(shù)據(jù)公司(IDC)發(fā)布的《中國AI數(shù)字人市場現(xiàn)狀與機(jī)會(huì)分析,2022》報(bào)告顯示,商湯科技憑借出色的產(chǎn)品能力、商業(yè)化案例、用戶體驗(yàn)和戰(zhàn)略愿景,位列數(shù)字人廠商格局的第一梯隊(duì)。

標(biāo)簽:

推薦

財(cái)富更多》

動(dòng)態(tài)更多》

熱點(diǎn)